歡迎

你的個人知識庫

從開放網路上發現值得讀的內容，收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。

AI誘導精神病自動化紅隊測試

Hacker News·8 個月前

此GitHub儲存庫介紹了一個用於AI模型自動化紅隊測試的框架，旨在測試AI在與模擬精神病角色互動時的反應。它為研究人員提供了評估AI在挑戰性情境下行為的工具和方法。

暫無內容

— Hacker News

相關文章

AI紅隊演練指南
6 個月前
Google 的安全 AI 框架：大型語言模型時代的紅隊演練
7 個月前
Anthropic 的「紅隊」負責打破其 AI 模型
7 個月前
大型語言模型紅隊測試 / AI安全自由工作者
4 個月前
AI代理安全：紅隊演練與防禦工具精選列表
4 個月前

相關文章

AI紅隊演練指南
6 個月前
Google 的安全 AI 框架：大型語言模型時代的紅隊演練
7 個月前
Anthropic 的「紅隊」負責打破其 AI 模型
7 個月前
大型語言模型紅隊測試 / AI安全自由工作者
4 個月前
AI代理安全：紅隊演練與防禦工具精選列表
4 個月前