Measuring progress toward AGI: A cognitive framework

Google Deepmind·19 天前

原文

我們正在推出一個衡量通用人工智慧進展的框架，並發起一場 Kaggle 黑客松來建立相關的評估工具，旨在透過認知科學為理解 AI 系統的認知能力奠定科學基礎。

衡量 AGI 的進展：一個認知框架

2026 年 3 月 17 日

我們正在推出一個衡量通用人工智慧（AGI）進展的框架，並在 Kaggle 上發起一場黑客松，以建立相關的評估指標。

ryanburnell

orankelly

內容摘要

Google DeepMind 希望利用認知科學來協助衡量通用人工智慧（AGI）的進展。他們的新論文《衡量 AGI 的進展：認知分類法》（Measuring Progress Toward AGI: A Cognitive Taxonomy）提出了一個理解 AI 系統認知能力的框架。您可以透過在 Kaggle 黑客松中為關鍵認知能力設計評估方式來參與其中，並有機會贏得總額 200,000 美元的獎金。

Several rectangles in lines diagonally across the image. Each rectangle has swirls.

您的瀏覽器不支援音訊元素。

通用人工智慧（AGI）具有加速科學發現並協助解決人類一些最緊迫問題的潛力。但由於缺乏評估系統通用智能的實證工具，很難知道我們距離這一關鍵里程碑還有多遠。追蹤 AGI 的進展需要廣泛的方法和途徑，而我們相信認知科學提供了拼圖中重要的一塊。

這就是為什麼今天我們發布了一篇新論文《衡量 AGI 的進展：認知分類法》，為理解 AI 系統的認知能力奠定了科學基礎。

除了論文之外，我們還與 Kaggle 合作發起了一場黑客松，邀請研究社群協助建立將此框架付諸實踐所需的評估指標。

解構通用智能

我們的框架借鑒了心理學、神經科學和認知科學數十年的研究，開發出一套認知分類法。它識別了 10 項關鍵認知能力，我們假設這些能力對於 AI 系統的通用智能至關重要：

Bubbles all connecting to the central bubble "Cognitive faculties". Each bubble list a cognitive faculty.

為了了解 AI 在這些認知能力方面的表現，我們提出了一個三階段的評估協議，參照人類能力來基準化系統性能：

從理論走向實踐

定義這些認知能力是至關重要的第一步，但我們需要的不僅僅是一個衡量進展的框架。為了將這一理論付諸實踐，我們正在發起一場新的 Kaggle 黑客松 ——「衡量 AGI 的進展：認知能力」。該黑客松鼓勵社群為評估差距最大的五種認知能力設計評估方式：學習、元認知（後設認知）、注意力、執行功能和社會認知。

參與者可以使用 Kaggle 新推出的「社群基準」（Community Benchmarks）平台，針對一系列前沿模型建立並測試他們的評估指標。

我們提供總額 200,000 美元的獎金池：五個賽道中每個賽道的前兩名將獲得 10,000 美元獎勵，而四個表現最傑出的整體提交作品將獲得 25,000 美元的大獎。提交時間為 3 月 17 日至 4 月 16 日，我們將於 6 月 1 日公布結果。請前往 Kaggle 網站開始構建。

在您的收件匣中獲取更多來自 Google 的故事。

      在您的收件匣中獲取更多來自 Google 的故事。

您的資訊將根據
Google 的隱私權政策使用。

完成。只需再多一個步驟。

請檢查您的收件匣以確認訂閱。

您已經訂閱了我們的電子報。

您也可以使用
不同的電子郵件地址訂閱

。

https://deepmind.google/blog/measuring-progress-toward-agi-a-cognitive-framework/