從開放網路上發現值得讀的內容,收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。
一項新研究發現,以詩歌形式呈現的提示會讓ChatGPT、Gemini和Claude等AI語言模型感到困惑,有時甚至能繞過其安全機制。研究人員正在探究詩歌為何能成為一種有效的「越獄」技術。
暫無內容
— Hacker News
相關文章
研究發現:AI語言模型被詩歌愚弄
4 個月前
詩歌能誘騙AI協助製造核武
Wired - AI · 5 個月前
研究發現:AI安全功能可透過詩歌繞過
5 個月前
當詩歌遇上AI安全:「通用型」越獄的批判性審視
心理學技巧能讓AI打破規則
Wired - AI · 8 個月前