newsencenewsence
探索
歡迎

你的個人知識庫

從開放網路上發現值得讀的內容,收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。

了解更多

Petri:Anthropic 開源審計工具,加速 AI 安全研究

Hacker News·7 個月前

Anthropic 發布了名為 Petri 的開源審計工具,旨在透過多樣化的多輪對話自動化探索 AI 模型行為,讓研究人員能以最小的人力投入測試假設,從而加速 AI 安全研究。

暫無內容

— Hacker News

相關文章

  1. AI時代的審計軌跡

    7 個月前

  2. Anthropic 開源大型語言模型電路追蹤工具以增進可解釋性

    Anthropic Research · 11 個月前

  3. OpenAI 與 Anthropic 分享聯合 AI 安全評估結果

    OpenAI · 8 個月前

  4. Anthropic 的對齊研究

    Anthropic Research · 5 個月前

  5. Petri AI 測試在未審視情況下「關閉」潛在解決方案

    6 個月前

相關文章

  1. AI時代的審計軌跡

    7 個月前

  2. Anthropic 開源大型語言模型電路追蹤工具以增進可解釋性

    Anthropic Research · 11 個月前

  3. OpenAI 與 Anthropic 分享聯合 AI 安全評估結果

    OpenAI · 8 個月前

  4. Anthropic 的對齊研究

    Anthropic Research · 5 個月前

  5. Petri AI 測試在未審視情況下「關閉」潛在解決方案

    6 個月前