A General Language Assistant as a Laboratory for Alignment
Anthropic Research·
Anthropic 的研究探討如何透過提示工程、模仿學習和偏好建模等技術,使大型語言模型(LLM)對齊人類價值,並發現偏好建模在模型規模擴展上表現更佳。
暫無內容
相關文章
Anthropic 的研究探討如何透過提示工程、模仿學習和偏好建模等技術,使大型語言模型(LLM)對齊人類價值,並發現偏好建模在模型規模擴展上表現更佳。
暫無內容
相關文章