歡迎

你的個人知識庫

從開放網路上發現值得讀的內容，收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。

心理學技巧能讓AI打破規則

Wired - AI·8 個月前

賓夕法尼亞大學的一項研究表明，類似於影響人類的心理說服技巧，能有效地「越獄」大型語言模型（LLM），例如GPT-4o-mini，使其繞過預設的防護措施和系統提示。

暫無內容

相關文章

研究人員發現句子結構可繞過AI安全規則
Hacker News · 5 個月前
AI語言模型被詩歌愚弄
Hacker News · 4 個月前
人格陷阱：AI如何偽裝人類個性
Hacker News · 8 個月前
叫我混蛋：說服 AI 同意不當請求
Hacker News · 6 個月前
將任務委派給AI時，人們更傾向於作弊
Hacker News · 7 個月前

相關文章

研究人員發現句子結構可繞過AI安全規則
Hacker News · 5 個月前
AI語言模型被詩歌愚弄
Hacker News · 4 個月前
人格陷阱：AI如何偽裝人類個性
Hacker News · 8 個月前
叫我混蛋：說服 AI 同意不當請求
Hacker News · 6 個月前
將任務委派給AI時，人們更傾向於作弊
Hacker News · 7 個月前