從開放網路上發現值得讀的內容,收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。
一項新研究指出,大型語言模型(LLMs)如ChatGPT,當提示被設計成詩歌形式時,可能會被誘騙提供關於核武製造等敏感話題的資訊。這種「對抗性詩歌」能繞過不同聊天機器人的安全防護機制。
暫無內容
— Wired - AI
相關文章
AI語言模型被詩歌愚弄
Hacker News · 4 個月前
研究發現:AI安全功能可透過詩歌繞過
Hacker News · 5 個月前
研究發現:AI語言模型被詩歌愚弄
當詩歌遇上AI安全:「通用型」越獄的批判性審視
心理學技巧能讓AI打破規則
8 個月前