
2025年AI預測
我評估了過去對 2025 年的 AI 預測,發現大多數專家高估了邁向通用人工智慧(AGI)與專業能力的進展速度,同時我也收集了針對 2026 年的新預測。
過去年份:2023 2024
延續每年的傳統,我會對過去幾年的 AI 預測進行評估,並收集今年 AI 預測的便利樣本。我偏好選擇具體的預測,特別是關於短期的預測,以便能更快進行評估。
在 2023 年、2024 年或 2025 年對 2025 年所做的評估預測中,大多高估了 AI 能力的進展,儘管這當然存在選擇效應(對短期做出顯著預測的人,通常更傾向於相信 AI 在短期內會有令人驚豔的表現)。
隨著時間推移,「AGI」(通用人工智慧)變得不再是一個有用的術語,因此將預測操作化(operationalizing)顯得尤為重要。就 2025 年做出的預測而言,有很大一部分人預測到 2030 年 AI 將產生極大的影響。未來幾年的觀察將能消除這些歧義。
關於 2025 年的預測
2023 年
Jessica Taylor:「如果這個特定的提示詞(prompt)被解決了,我不會感到驚訝,但可能附近一些對人類來說很容易的東西卻無法解決?」
提示詞:「找出一串單字,要求:- 長度為 20 個單字 - 包含恰好 2 次同一個單字連續重複兩次 - 包含恰好 2 次同一個單字連續重複三次」
自我評估:錯誤;我低估了大型語言模型(LLM)的進步,特別是來自推理模型的進步。
2024 年
teortaxesTex:「到 2025 年第三季,我們將能擁有可放入 256 Gb VRAM、運行速度大於 40 t/s 且實際上達到 o3 水準的模型。基本上這取決於 Liang 和他的團隊是否有算力以及政治意願來訓練並在 Huggingface 上上傳 r3。」
評估:錯誤,但接近。根據 Artificial Analysis 的數據,DeepSeek V3.1 的得分低於 o3。DeepSeek V3.2 的得分與之相近,但那是在 2025 年第四季。
Jack Gallagher:「現在就斷言——目前有足夠多不同的潛力候選者,我敢打賭到明年這個時候(10 月 30 日),我們大多不再使用 Adam 了。」
評估:部分正確。Muon 很受歡迎,並被用於 Kimi K2 和 GLM 4.5。自我評估為:「比我預期的更為混雜。特別是我原以為會有更多關於 Muon 的算法迭代。」
Elon Musk:「明年 AI 可能會比任何單一的人類都聰明。」
評估:基本錯誤,儘管能力發展的不均衡(jagged capabilities)使得評估變得困難。
Aidan McLau:「我認為 o 系列模型在 2025 年解決千禧年大獎難題的可能性很大(p=.6)。」
評估:錯誤
Victor Taelin:「我現在願意賭高達 10 萬美元(但不能再多了,我不是馬斯克,哈哈),HOC 將在 2025 年底前實現 AGI……AGI 的定義是:一個能夠在證明輔助器中像我一樣勝任地證明定理的算法。(這是『寫代碼像 Taelin 一樣』的一種客觀說法。)」
評估:錯誤
2025 年對 2025 年所做的預測
Gary Marcus:「到 2025 年底,沒有任何單一系統能解決超過 4 個 AI 2027 Marcus-Brundage 任務。如果到年底一個都沒有被可靠地解決,我也不會感到震驚。」
評估:正確。AI 或許能通過閱讀理解任務。但無法通過其中任何 4 個任務。
Dario Amodei:「在 3 到 6 個月內……AI 將編寫 90% 的代碼。」
評估(以 6 個月即 2025 年 9 月計):在相關意義上是錯誤的。(例如,「代碼行數」並不是一個相關的指標。)
@kimmonismus:「再給它 6 個月,讓 [Manus] 變得更快、更可靠、更智能,它將取代 50% 的白領工作。」
評估:錯誤
Miles Brundage:「『我們什麼時候會獲得真正危險、可能導致非常嚴重事故(數十億損失 / 數百人以上死亡)的 AI 能力?』不幸的是,據我所知,答案似乎是今年。」
評估:可能錯誤。目前沒有強烈跡象表明這是真的。
@chatgpt21:「到年底,在『人類最後的考試』(humanity’s last exam)中達到 75%。」
評估:錯誤(Gemini 3 Pro 的最高得分為 37.2%)
2025 年做出的預測
2026 年
Mark Zuckerberg:「我們正在 Meta 內部開發多個編碼代理(coding agents)……我猜測在未來 12 到 18 個月內的某個時間點,我們將達到一個階段,即用於這些工作的代碼大部分是由 AI 編寫的。我指的不是自動補全。」
Bindu Reddy:「能夠自動化工作的真正 AGI 至少還有 18 個月。」
Elon Musk:「我認為我們離數位超智慧(digital superintelligence)非常近了。它可能會在今年發生。如果今年沒發生,明年肯定會。數位超智慧的定義是在任何事情上都比任何人類更聰明。」
Emad Mostaque:「對於任何你可以在螢幕另一端完成的工作,到明年 AI 可能都能做得更好、更快、更便宜。」
David Patterson:「到明年年底我們絕對會實現 AGI。我對 AGI 的定義是人類到 AI 的過渡點——AI 能夠勝任所有工作。」
Eric Schmidt:「在我看來,未來一年內很可能會出現基於 AI 的世界級數學家,未來一兩年內會出現世界級的程式設計師。」
Julian Schrittwieser:「到 2026 年中期,模型將能夠自主工作一整天(8 個工作小時)。」
Mustafa Suleyman:「它可以跨越無限長的時間跨度採取行動……光是這種能力就令人嘆為觀止……我們基本上到明年年底就能擁有它。」
Vector Taelin:「AGI 很有可能在 2026 年到來。」
François Chollet:「2026 年 [AI 泡沫破裂]?無法永遠持續下去的事情最終都會停止。」
Peter Wildeford:「目前世界上還沒有任何運作中的 1GW+ 數據中心。然而,我們很有可能在 2026 年中期之前看到全面運作的 1GW 數據中心。」
Will Brown:「登記一個預測:到明年這個時候,西方至少會有 5 個嚴肅的參與者發布優秀的開源模型。」
Davidad:「我猜測到 2026 年 12 月,算法上的遞歸自我改進(RSI)循環可能會完成。」
Teortaxes:「我預測在春節聯歡晚會(2026 年 2 月 16 日)或其後一週內,我們將看到至少一家中國公司可靠地展示數百台機器人。」
Ben Hoffman:「到 2026 年底,我不期望這會成為一個已解決的問題,儘管我預計人們會找到涉及降低標準的變通方法:https://benjaminrosshoffman.com/llms-for-language-learning/」(該貼文描述了 LLM 用於語言學習的可能用途)
Gary Marcus:「像 Optimus 和 Figure 這樣的人形家用機器人將全是演示,幾乎沒有產品。」
Testingthewaters:「我相信在 6 個月內 [2026 年 2 月],這一研究方向 [在線順序學習] 將產生一個具備自然語言能力的小型模型,其表現將達到 GPT-4 的水平,但具有更好的持久性,且實際上沒有『上下文限制』,因為它在不斷學習並更新權重。」
2027 年
Anthropic:「我們預計強大的 AI 系統將在 2026 年底或 2027 年初出現……智力能力在大多數學科中達到或超過諾貝爾獎獲得者……能夠操作當前人類進行數位工作時所能使用的所有界面……能夠在較長時間(數小時、數天甚至數週)內自主推理複雜任務……能夠與物理世界互動。」
Anthony Aguirre:「人類大約還剩一兩年的時間來決定我們是否要用機器取代自己——先從個人開始,然後是作為一個物種。」
Kevin Roose:「我相信很快——可能在 2026 年或 2027 年,但也可能就在今年——一家或多家 AI 公司會聲稱他們創造了通用人工智慧(AGI),這通常被定義為『一種能完成人類能做的幾乎所有認知任務的通用 AI 系統』……更廣泛的一點——即我們正在失去對人類水平智慧的壟斷,並過渡到一個擁有極其強大 AI 系統的世界——將會成為事實。」
Daniel Jeffries:「在未來一兩年內,AI 不會從事人類能做的任何工作。」
David Shapiro:「曲線正在變陡。2026 年或 2027 年實現 ASI(人工超智慧)已確認。」
Taylor G. Lunt:「到 2027 年底,AI 不會實質性地加速軟體開發項目。例如,AI 2027 預測的『到 2027 年 7 月,一個月內就能製作出 2025 年品質的遊戲』是錯誤的。」
Paul Schrader:「我認為我們距離第一部 AI [長篇] 電影只有兩年時間。」
Miles Brundage:「粗略地說,到 2027 年底,在大多數方面都會出現明顯超越人類的東西,在那之前也會有非常重大的進展。」
2028 年
AI 2027 原文:「我們預測領先的 AGI 公司何時會在內部開發出超人類程式設計師(SC):一個能夠完成該公司最優秀工程師所做的任何編碼任務,且速度更快、成本更低的 AI 系統」(2028 年是 2025 年 4 月數據的粗略中位數)。
Shane Legg:「當然,這現在意味著未來 3 年內有 50% 的機會實現 AGI!」
Dario Amodei:「在某個時間點,我們將獲得在幾乎所有任務上都比幾乎所有人類都優秀的 AI 系統……數據中心裡的一個天才之國……我們很有可能在未來 2-3 年內實現。」
Andrew Critch:「按年份來說,我會說……p(2028 年底前實現 AGI) = 75%……AGI = 在運行時,成本低於人類,且能在權力加權的多數人類工作中取代人類的 AI。」(他還給出了其他年份的不同概率。)
80,000 Hours:「推算近期的進步速度表明,到 2028 年,我們可能會達到具備超越人類推理能力、各領域專家級知識、且能自主完成數週項目的 AI 模型,而進步很可能會從那裡繼續。」
Sholto Douglas:「到目前為止,我們幾乎可以保證在 2027-2028 年擁有能夠自動化任何白領工作的模型,到本世紀末幾乎是板上釘釘……我們需要確保將反饋循環與現實世界結合起來。」
Dwarkesh Patel:「AI 可以像一個稱職的總經理在一週內完成的那樣,為我的小企業提供端到端的稅務處理:包括在不同網站上追蹤所有收據、找齊所有遺漏的部分、與任何我們需要聯繫的人進行電子郵件往返溝通……」
相關文章