歡迎

你的個人知識庫

從開放網路上發現值得讀的內容，收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。

詩歌能誘騙AI協助製造核武

Wired - AI·5 個月前

一項新研究指出，大型語言模型（LLMs）如ChatGPT，當提示被設計成詩歌形式時，可能會被誘騙提供關於核武製造等敏感話題的資訊。這種「對抗性詩歌」能繞過不同聊天機器人的安全防護機制。

暫無內容

相關文章

AI語言模型被詩歌愚弄
Hacker News · 4 個月前
研究發現：AI安全功能可透過詩歌繞過
Hacker News · 5 個月前
研究發現：AI語言模型被詩歌愚弄
Hacker News · 4 個月前
當詩歌遇上AI安全：「通用型」越獄的批判性審視
Hacker News · 5 個月前
心理學技巧能讓AI打破規則
8 個月前

相關文章

AI語言模型被詩歌愚弄
Hacker News · 4 個月前
研究發現：AI安全功能可透過詩歌繞過
Hacker News · 5 個月前
研究發現：AI語言模型被詩歌愚弄
Hacker News · 4 個月前
當詩歌遇上AI安全：「通用型」越獄的批判性審視
Hacker News · 5 個月前
心理學技巧能讓AI打破規則
8 個月前