衡量人工智慧完成長任務的能力 – METR

Hacker News·9 個月前

此研究介紹了METR，一種衡量人工智慧（AI）表現的指標，該指標基於AI代理能夠完成任務的長度。研究顯示，此能力在過去六年呈現指數級增長，預測在十年內，AI代理將能獨立處理大量目前需要人類數天或數週才能完成的軟體任務。

暫無內容

— Hacker News

相關文章