Petri AI 測試在未審視情況下「關閉」潛在解決方案

Hacker News·

GitHub 上的 Petri 專案問題詳述了將 BonepokeOS 認知架構納入 Petri 的對齊審計進行測試的嘗試。作者整合了 BonepokeOS,一個用於敘事連貫性分析的系統,並對其在專業紅隊測試下的行為表示好奇,旨在進行實證觀察而非基於假設的測試。

暫無內容

Hacker News

相關文章

  1. Petri:Anthropic 開源審計工具,加速 AI 安全研究

    7 個月前

  2. AI誘導精神病自動化紅隊測試

    8 個月前

  3. Ask HN:您如何進行 AI / LLM 的整合測試?

    4 個月前

  4. 使用同步屏障測試 Postgres 的競態條件

    2 個月前

  5. 評估思維鏈的可監測性

    OpenAI · 4 個月前