newsencenewsence
探索
歡迎

你的個人知識庫

從開放網路上發現值得讀的內容,收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。

了解更多

A General Language Assistant as a Laboratory for Alignment

Anthropic Research·超過 4 年前

Anthropic 的研究探討如何透過提示工程、模仿學習和偏好建模等技術,使大型語言模型(LLM)對齊人類價值,並發現偏好建模在模型規模擴展上表現更佳。

暫無內容

— Anthropic Research

相關文章

  1. 大型語言模型中的對齊偽裝

    超過 1 年前

  2. Simulating large systems with Regression Language Models

    Google Research · 9 個月前

  3. 自動化對齊研究員:利用大型語言模型擴展可擴展監督規模

    9 天前

  4. 語言模型的隱藏目標審計

    大約 1 年前

  5. AI提示的藝術

    Hacker News · 7 個月前

相關文章

  1. 大型語言模型中的對齊偽裝

    超過 1 年前

  2. Simulating large systems with Regression Language Models

    Google Research · 9 個月前

  3. 自動化對齊研究員:利用大型語言模型擴展可擴展監督規模

    9 天前

  4. 語言模型的隱藏目標審計

    大約 1 年前

  5. AI提示的藝術

    Hacker News · 7 個月前