Circuits Updates – June 2024

Anthropic Research·

Anthropic 研究團隊發布了 2024 年 6 月的 Circuits Updates,分享了多項正在發展中的研究想法,包括監控和控制語言模型角色特徵的 Persona vectors,以及探討 Claude 模型運行小型商店和潛在的代理人錯位問題。

暫無內容

Anthropic Research

相關文章

  1. Circuits Updates – July 2024

    超過 1 年前

  2. Circuits Updates – August 2024

    超過 1 年前

  3. 電路更新 – 2024年9月

    超過 1 年前

  4. A Mathematical Framework for Transformer Circuits

    超過 4 年前

  5. 關於Crosscoder模型差異比較的見解

    大約 1 年前