2025年AI預測

Lesswrong·4 個月前

我評估了過去對 2025 年的 AI 預測，發現大多數專家高估了邁向通用人工智慧（AGI）與專業能力的進展速度，同時我也收集了針對 2026 年的新預測。

過去年份：2023 2024

延續每年的傳統，我會對過去幾年的 AI 預測進行評估，並收集今年 AI 預測的便利樣本。我偏好選擇具體的預測，特別是關於短期的預測，以便能更快進行評估。

在 2023 年、2024 年或 2025 年對 2025 年所做的評估預測中，大多高估了 AI 能力的進展，儘管這當然存在選擇效應（對短期做出顯著預測的人，通常更傾向於相信 AI 在短期內會有令人驚豔的表現）。

隨著時間推移，「AGI」（通用人工智慧）變得不再是一個有用的術語，因此將預測操作化（operationalizing）顯得尤為重要。就 2025 年做出的預測而言，有很大一部分人預測到 2030 年 AI 將產生極大的影響。未來幾年的觀察將能消除這些歧義。

關於 2025 年的預測

2023 年

Jessica Taylor：「如果這個特定的提示詞（prompt）被解決了，我不會感到驚訝，但可能附近一些對人類來說很容易的東西卻無法解決？」

提示詞：「找出一串單字，要求：- 長度為 20 個單字 - 包含恰好 2 次同一個單字連續重複兩次 - 包含恰好 2 次同一個單字連續重複三次」

自我評估：錯誤；我低估了大型語言模型（LLM）的進步，特別是來自推理模型的進步。

2024 年

teortaxesTex：「到 2025 年第三季，我們將能擁有可放入 256 Gb VRAM、運行速度大於 40 t/s 且實際上達到 o3 水準的模型。基本上這取決於 Liang 和他的團隊是否有算力以及政治意願來訓練並在 Huggingface 上上傳 r3。」

評估：錯誤，但接近。根據 Artificial Analysis 的數據，DeepSeek V3.1 的得分低於 o3。DeepSeek V3.2 的得分與之相近，但那是在 2025 年第四季。

Jack Gallagher：「現在就斷言——目前有足夠多不同的潛力候選者，我敢打賭到明年這個時候（10 月 30 日），我們大多不再使用 Adam 了。」

評估：部分正確。Muon 很受歡迎，並被用於 Kimi K2 和 GLM 4.5。自我評估為：「比我預期的更為混雜。特別是我原以為會有更多關於 Muon 的算法迭代。」

Elon Musk：「明年 AI 可能會比任何單一的人類都聰明。」

評估：基本錯誤，儘管能力發展的不均衡（jagged capabilities）使得評估變得困難。

Aidan McLau：「我認為 o 系列模型在 2025 年解決千禧年大獎難題的可能性很大（p=.6）。」

評估：錯誤

Victor Taelin：「我現在願意賭高達 10 萬美元（但不能再多了，我不是馬斯克，哈哈），HOC 將在 2025 年底前實現 AGI……AGI 的定義是：一個能夠在證明輔助器中像我一樣勝任地證明定理的算法。（這是『寫代碼像 Taelin 一樣』的一種客觀說法。）」

評估：錯誤

2025 年對 2025 年所做的預測

Gary Marcus：「到 2025 年底，沒有任何單一系統能解決超過 4 個 AI 2027 Marcus-Brundage 任務。如果到年底一個都沒有被可靠地解決，我也不會感到震驚。」

評估：正確。AI 或許能通過閱讀理解任務。但無法通過其中任何 4 個任務。

Dario Amodei：「在 3 到 6 個月內……AI 將編寫 90% 的代碼。」

評估（以 6 個月即 2025 年 9 月計）：在相關意義上是錯誤的。（例如，「代碼行數」並不是一個相關的指標。）

@kimmonismus：「再給它 6 個月，讓 [Manus] 變得更快、更可靠、更智能，它將取代 50% 的白領工作。」

評估：錯誤

Miles Brundage：「『我們什麼時候會獲得真正危險、可能導致非常嚴重事故（數十億損失 / 數百人以上死亡）的 AI 能力？』不幸的是，據我所知，答案似乎是今年。」

評估：可能錯誤。目前沒有強烈跡象表明這是真的。

@chatgpt21：「到年底，在『人類最後的考試』（humanity’s last exam）中達到 75%。」

評估：錯誤（Gemini 3 Pro 的最高得分為 37.2%）

2025 年做出的預測

2026 年

Mark Zuckerberg：「我們正在 Meta 內部開發多個編碼代理（coding agents）……我猜測在未來 12 到 18 個月內的某個時間點，我們將達到一個階段，即用於這些工作的代碼大部分是由 AI 編寫的。我指的不是自動補全。」

Bindu Reddy：「能夠自動化工作的真正 AGI 至少還有 18 個月。」

Elon Musk：「我認為我們離數位超智慧（digital superintelligence）非常近了。它可能會在今年發生。如果今年沒發生，明年肯定會。數位超智慧的定義是在任何事情上都比任何人類更聰明。」

Emad Mostaque：「對於任何你可以在螢幕另一端完成的工作，到明年 AI 可能都能做得更好、更快、更便宜。」

David Patterson：「到明年年底我們絕對會實現 AGI。我對 AGI 的定義是人類到 AI 的過渡點——AI 能夠勝任所有工作。」

Eric Schmidt：「在我看來，未來一年內很可能會出現基於 AI 的世界級數學家，未來一兩年內會出現世界級的程式設計師。」

Julian Schrittwieser：「到 2026 年中期，模型將能夠自主工作一整天（8 個工作小時）。」

Mustafa Suleyman：「它可以跨越無限長的時間跨度採取行動……光是這種能力就令人嘆為觀止……我們基本上到明年年底就能擁有它。」

Vector Taelin：「AGI 很有可能在 2026 年到來。」

François Chollet：「2026 年 [AI 泡沫破裂]？無法永遠持續下去的事情最終都會停止。」

Peter Wildeford：「目前世界上還沒有任何運作中的 1GW+ 數據中心。然而，我們很有可能在 2026 年中期之前看到全面運作的 1GW 數據中心。」

Will Brown：「登記一個預測：到明年這個時候，西方至少會有 5 個嚴肅的參與者發布優秀的開源模型。」

Davidad：「我猜測到 2026 年 12 月，算法上的遞歸自我改進（RSI）循環可能會完成。」

Teortaxes：「我預測在春節聯歡晚會（2026 年 2 月 16 日）或其後一週內，我們將看到至少一家中國公司可靠地展示數百台機器人。」

Ben Hoffman：「到 2026 年底，我不期望這會成為一個已解決的問題，儘管我預計人們會找到涉及降低標準的變通方法：https://benjaminrosshoffman.com/llms-for-language-learning/」（該貼文描述了 LLM 用於語言學習的可能用途）

Gary Marcus：「像 Optimus 和 Figure 這樣的人形家用機器人將全是演示，幾乎沒有產品。」

Testingthewaters：「我相信在 6 個月內 [2026 年 2 月]，這一研究方向 [在線順序學習] 將產生一個具備自然語言能力的小型模型，其表現將達到 GPT-4 的水平，但具有更好的持久性，且實際上沒有『上下文限制』，因為它在不斷學習並更新權重。」

2027 年

Anthropic：「我們預計強大的 AI 系統將在 2026 年底或 2027 年初出現……智力能力在大多數學科中達到或超過諾貝爾獎獲得者……能夠操作當前人類進行數位工作時所能使用的所有界面……能夠在較長時間（數小時、數天甚至數週）內自主推理複雜任務……能夠與物理世界互動。」

Anthony Aguirre：「人類大約還剩一兩年的時間來決定我們是否要用機器取代自己——先從個人開始，然後是作為一個物種。」

Kevin Roose：「我相信很快——可能在 2026 年或 2027 年，但也可能就在今年——一家或多家 AI 公司會聲稱他們創造了通用人工智慧（AGI），這通常被定義為『一種能完成人類能做的幾乎所有認知任務的通用 AI 系統』……更廣泛的一點——即我們正在失去對人類水平智慧的壟斷，並過渡到一個擁有極其強大 AI 系統的世界——將會成為事實。」

Daniel Jeffries：「在未來一兩年內，AI 不會從事人類能做的任何工作。」

David Shapiro：「曲線正在變陡。2026 年或 2027 年實現 ASI（人工超智慧）已確認。」

Taylor G. Lunt：「到 2027 年底，AI 不會實質性地加速軟體開發項目。例如，AI 2027 預測的『到 2027 年 7 月，一個月內就能製作出 2025 年品質的遊戲』是錯誤的。」

Paul Schrader：「我認為我們距離第一部 AI [長篇] 電影只有兩年時間。」

Miles Brundage：「粗略地說，到 2027 年底，在大多數方面都會出現明顯超越人類的東西，在那之前也會有非常重大的進展。」

2028 年

AI 2027 原文：「我們預測領先的 AGI 公司何時會在內部開發出超人類程式設計師（SC）：一個能夠完成該公司最優秀工程師所做的任何編碼任務，且速度更快、成本更低的 AI 系統」（2028 年是 2025 年 4 月數據的粗略中位數）。

Shane Legg：「當然，這現在意味著未來 3 年內有 50% 的機會實現 AGI！」

Dario Amodei：「在某個時間點，我們將獲得在幾乎所有任務上都比幾乎所有人類都優秀的 AI 系統……數據中心裡的一個天才之國……我們很有可能在未來 2-3 年內實現。」

Andrew Critch：「按年份來說，我會說……p(2028 年底前實現 AGI) = 75%……AGI = 在運行時，成本低於人類，且能在權力加權的多數人類工作中取代人類的 AI。」（他還給出了其他年份的不同概率。）

80,000 Hours：「推算近期的進步速度表明，到 2028 年，我們可能會達到具備超越人類推理能力、各領域專家級知識、且能自主完成數週項目的 AI 模型，而進步很可能會從那裡繼續。」

Sholto Douglas：「到目前為止，我們幾乎可以保證在 2027-2028 年擁有能夠自動化任何白領工作的模型，到本世紀末幾乎是板上釘釘……我們需要確保將反饋循環與現實世界結合起來。」

Dwarkesh Patel：「AI 可以像一個稱職的總經理在一週內完成的那樣，為我的小企業提供端到端的稅務處理：包括在不同網站上追蹤所有收據、找齊所有遺漏的部分、與任何我們需要聯繫的人進行電子郵件往返溝通……」

— Lesswrong

你的個人知識庫

2025年AI預測

關於 2025 年的預測

2023 年

2024 年

2025 年對 2025 年所做的預測

2025 年做出的預測

2026 年

2027 年

2028 年