Anthropic 開源大型語言模型電路追蹤工具以增進可解釋性

Anthropic Research·11 個月前

Anthropic 開源了其在大型語言模型可解釋性研究中開發的電路追蹤工具。這些工具能讓研究人員生成並探索 AI 模型內部的決策路徑，以增進對 AI 的理解。

暫無內容

— Anthropic Research

相關文章