
Measuring progress toward AGI: A cognitive framework
我們正在推出一個衡量通用人工智慧進展的框架,並發起一場 Kaggle 黑客松來建立相關的評估工具,旨在透過認知科學為理解 AI 系統的認知能力奠定科學基礎。
衡量 AGI 的進展:一個認知框架
2026 年 3 月 17 日
我們正在推出一個衡量通用人工智慧(AGI)進展的框架,並在 Kaggle 上發起一場黑客松,以建立相關的評估指標。


內容摘要
Google DeepMind 希望利用認知科學來協助衡量通用人工智慧(AGI)的進展。他們的新論文《衡量 AGI 的進展:認知分類法》(Measuring Progress Toward AGI: A Cognitive Taxonomy)提出了一個理解 AI 系統認知能力的框架。您可以透過在 Kaggle 黑客松中為關鍵認知能力設計評估方式來參與其中,並有機會贏得總額 200,000 美元的獎金。

您的瀏覽器不支援音訊元素。
通用人工智慧(AGI)具有加速科學發現並協助解決人類一些最緊迫問題的潛力。但由於缺乏評估系統通用智能的實證工具,很難知道我們距離這一關鍵里程碑還有多遠。追蹤 AGI 的進展需要廣泛的方法和途徑,而我們相信認知科學提供了拼圖中重要的一塊。
這就是為什麼今天我們發布了一篇新論文《衡量 AGI 的進展:認知分類法》,為理解 AI 系統的認知能力奠定了科學基礎。
除了論文之外,我們還與 Kaggle 合作發起了一場黑客松,邀請研究社群協助建立將此框架付諸實踐所需的評估指標。
解構通用智能
我們的框架借鑒了心理學、神經科學和認知科學數十年的研究,開發出一套認知分類法。它識別了 10 項關鍵認知能力,我們假設這些能力對於 AI 系統的通用智能至關重要:

為了了解 AI 在這些認知能力方面的表現,我們提出了一個三階段的評估協議,參照人類能力來基準化系統性能:
從理論走向實踐
定義這些認知能力是至關重要的第一步,但我們需要的不僅僅是一個衡量進展的框架。為了將這一理論付諸實踐,我們正在發起一場新的 Kaggle 黑客松 ——「衡量 AGI 的進展:認知能力」。該黑客松鼓勵社群為評估差距最大的五種認知能力設計評估方式:學習、元認知(後設認知)、注意力、執行功能和社會認知。
參與者可以使用 Kaggle 新推出的「社群基準」(Community Benchmarks)平台,針對一系列前沿模型建立並測試他們的評估指標。
我們提供總額 200,000 美元的獎金池:五個賽道中每個賽道的前兩名將獲得 10,000 美元獎勵,而四個表現最傑出的整體提交作品將獲得 25,000 美元的大獎。提交時間為 3 月 17 日至 4 月 16 日,我們將於 6 月 1 日公布結果。請前往 Kaggle 網站開始構建。
在您的收件匣中獲取更多來自 Google 的故事。
在您的收件匣中獲取更多來自 Google 的故事。
您的資訊將根據
Google 的隱私權政策使用。
完成。只需再多一個步驟。
請檢查您的收件匣以確認訂閱。
您已經訂閱了我們的電子報。
您也可以使用
不同的電子郵件地址訂閱
。