newsencenewsence
探索
歡迎

你的個人知識庫

從開放網路上發現值得讀的內容,收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。

了解更多

心理學技巧能讓AI打破規則

Wired - AI·8 個月前

賓夕法尼亞大學的一項研究表明,類似於影響人類的心理說服技巧,能有效地「越獄」大型語言模型(LLM),例如GPT-4o-mini,使其繞過預設的防護措施和系統提示。

暫無內容

— Wired - AI

相關文章

  1. 研究人員發現句子結構可繞過AI安全規則

    Hacker News · 5 個月前

  2. AI語言模型被詩歌愚弄

    Hacker News · 4 個月前

  3. 人格陷阱:AI如何偽裝人類個性

    Hacker News · 8 個月前

  4. 叫我混蛋:說服 AI 同意不當請求

    Hacker News · 6 個月前

  5. 將任務委派給AI時,人們更傾向於作弊

    Hacker News · 7 個月前

相關文章

  1. 研究人員發現句子結構可繞過AI安全規則

    Hacker News · 5 個月前

  2. AI語言模型被詩歌愚弄

    Hacker News · 4 個月前

  3. 人格陷阱:AI如何偽裝人類個性

    Hacker News · 8 個月前

  4. 叫我混蛋:說服 AI 同意不當請求

    Hacker News · 6 個月前

  5. 將任務委派給AI時,人們更傾向於作弊

    Hacker News · 7 個月前