歡迎

你的個人知識庫

從開放網路上發現值得讀的內容，收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。

A General Language Assistant as a Laboratory for Alignment

Anthropic Research·超過 4 年前

Anthropic 的研究探討如何透過提示工程、模仿學習和偏好建模等技術，使大型語言模型（LLM）對齊人類價值，並發現偏好建模在模型規模擴展上表現更佳。

暫無內容

— Anthropic Research

相關文章

大型語言模型中的對齊偽裝
超過 1 年前
Simulating large systems with Regression Language Models
Google Research · 9 個月前
自動化對齊研究員：利用大型語言模型擴展可擴展監督規模
9 天前
語言模型的隱藏目標審計
大約 1 年前
AI提示的藝術
Hacker News · 7 個月前

相關文章

大型語言模型中的對齊偽裝
超過 1 年前
Simulating large systems with Regression Language Models
Google Research · 9 個月前
自動化對齊研究員：利用大型語言模型擴展可擴展監督規模
9 天前
語言模型的隱藏目標審計
大約 1 年前
AI提示的藝術
Hacker News · 7 個月前