大型語言模型中出現內省跡象

Anthropic Research·6 個月前

Anthropic 的研究表明，目前的大型語言模型（特別是其 Claude 模型）展現出一定程度的內省意識和對內部狀態的控制能力，儘管這種能力與人類相比仍有限且不可靠。

暫無內容

你的個人知識庫