評估AI 2027的2025年預測

Lesswrong·2 個月前

在 2026 年初，我們評估了 AI 2027 的預測，發現雖然定性描述大致符合進度，但定量指標的進展速度僅約為預測的 65%。這顯示從全自動化程式編寫到超人工智慧的過渡期，目前更可能發生在 2028 年中至 2030 年中之間。

AI 2027 曾為 2025 年至 2027 年的 AI 發展制定了詳細的情境藍圖，包括對 AI 領域的定量預測與定性描述。

現在我們正處於 2026 年初，可以來評分其 2025 年的預測與現實相比表現如何！這讓我們感到興奮，因為我們投入了大量精力為 AI 2027 填充具體且可證偽的預測，現在我們收穫了這些努力的成果：這是一種預測 AI 時間線的新方法，可與我們已在使用的其他方法互補。1

我們將回答的核心問題是：相對於 AI 2027 情境，AI 的進展速度有多快？

總體而言，定量指標的進展速度約為 AI 2027 預測速度的 65%。大多數定性預測則符合進度。

定量進展速度

對於定量預測，我們估算了一個「進展速度」倍數，其中 1x 代表進展與 AI 2027 的預測同步，2x 代表進展快兩倍，0.5x 代表進展速度只有一半。

*在顯示的總體數據中，現實進展速度約為 AI 2027 的 58-66%。若對個別預測而非預測類別進行匯總，會得到較高的結果（平均值 75%，中位數 84%），但我們認為這並非良好的指標；請參閱腳註。2

在 AI 2027 中，我們描繪了從全自動化編程到超智能（Superintelligence）的飛躍將在 2027 年間發生。

如果進展持續以我們描繪速度的 65% 進行，那麼這種飛躍最終將發生在 2027 年底到 2029 年中。然而，我們預計訓練算力和人力投入的增長會放緩，導致進展變慢（在考慮 AI 研發自動化之前）。3 使用 AI Futures 模型調整此因素後顯示，飛躍將稍晚發生，約在 2028 年中到 2030 年中。4

2028 年中比 Daniel 目前對全自動化編程的中位數預測（2029 年）要早，但到超智能的 2 年飛躍期比他的中位數飛躍速度（約 1 年）要慢。我（Eli）對全自動化編程的中位數預測是在 2030 年代初，而我的中位數飛躍速度約為 2 年。請參閱此處查看我們的預測。

您可以在此試算表中查看所有定量預測及其結果。

重點結論包括：

SWEBench-Verified 的進展出人意料地緩慢。 AI 2027 預測到 2025 年中得分將從 72% 起點達到 85%；實際最高得分為 74.5% (Opus 4.1)。這反映了 AI 2025 預測調查的結果，受訪者預測 2025 年底得分為 88%，而實際僅為 81%。
編程時間跨度（Coding time horizons）符合 AI-2027 速度模型的中心軌跡，但慢於一個錯誤繪製的軌跡。 METR 的 80% 編程時間跨度正在以我們 2025 年 4 月模型中 AI-2027 速度中心軌跡的 1.04 倍速度移動。5 然而，我們僅達到原分享圖表中顯示軌跡速度的 0.66 倍，該圖表包含一個錯誤（請在此處查看同一圖表上的兩條軌跡）。如果我們當時使用新模型進行預測，相對進展速度將介於 0.66 和 1.04 之間。
營收增長甚至（略微）快於 AI 2027 的預測，但估值落後。 OpenAI 的年化營收達到約 200 億美元，略高於 180 億美元的預測。在 AI 2025 預測調查中，預測者更大幅度地低估了營收；他們對 AGI 公司營收總和的預測低了約 2 倍。與此同時，截至 2025 年 10 月，OpenAI 的估值為 5000 億美元，高於我們發布 AI 2027 時的 3000 億美元。但在 AI 2027 的情境中，5000 億美元的估值在 2025 年 6 月就已達成，因此現實進度明顯落後。
AI 軟體研發提升（R&D uplift）落後於進度。 這主要是因為我們下調了對 2025 年初提升程度的估計，因此我們對 2025 年底的提升估計與最初對 AI 2027 開始時的估計相似。
算力增長基本符合進度，但最大規模訓練運行的增長可能是個例外。 我們估計目前還沒有領先的 AI 公司進行過比 2025 年 2 月發布的 GPT-4.5 規模顯著更大的訓練。然而，我們在此存在極大的不確定性。訓練算力的不透明性使得我們難以排除規模擴張的可能性，儘管我們的最佳猜測是單次訓練運行的算力尚未超過 GPT-4.5。

定性預測

以下我們評論 AI 2027 在定性方面的表現。來自 AI 2027 的文本以斜體表示。我們跳過了已進行定量評分的句子。

2025 年中

世界初次窺見 AI 代理（AI agents）的雛形。

電腦使用代理的廣告強調「個人助理」一詞：你可以向它們下達任務，例如「幫我在 DoorDash 訂一個捲餅」或「打開我的預算試算表並加總本月支出」。它們會根據需要向你確認：例如，請你確認購買。雖然比之前的版本（如 Operator）更先進，但它們仍難以獲得廣泛使用。

這似乎是正確的。2025 年 7 月發布的 ChatGPT agent 在其發布貼文頂部有一個動畫，顯示它在 Expedia 上預訂行程。這與 DoorDash 的例子非常相似。它們確實難以獲得廣泛普及。

與此同時，在公眾視線之外，更專業的編程和研究代理正開始改變其專業領域。

2024 年的 AI 可以遵循特定指令：它們能將要點轉化為電子郵件，將簡單請求轉化為可運行的程式碼。到了 2025 年， AI 的運作更像員工。編程 AI 越來越像自主代理而非單純的助手：透過 Slack 或 Teams 接收指令，並自行進行實質性的程式碼更改，有時能節省數小時甚至數天的時間。研究代理則花半小時搜尋網路來回答你的問題。

這看起來相當準確。來自 2025 年 9 月 2 日的消息：「Claude Code 迅速崛起——年化營收已超過 5 億美元，僅三個月內使用量就增長了 10 倍以上。」

代理的使用越來越具自主性，因此我們認為預測的核心精神是正確的，但我們不認為在 Slack 或 Teams 中的使用量有特別巨大。

這些代理在理論上（以及精選的範例中）令人印象深刻，但在實踐中並不可靠。AI 推特上到處都是任務以各種滑稽方式搞砸的故事。較好的代理也很昂貴；一分錢一分貨，最佳性能每月需花費數百美元。儘管如此，許多公司仍找到了將 AI 代理融入其工作流程的方法。

這在很大程度上是準確的。編程代理的可靠性可能比我們預期的略高一些。

2025 年底

（為了避免針對任何現有公司，我們將描述一家虛構的通用人工智慧公司，稱之為 OpenBrain。我們想像其他公司落後 OpenBrain 3-9 個月。）

競爭似乎比我們預測的更激烈，美國頂尖 AGI 公司之間的領先差距更像是 0-2 個月。

雖然模型在廣泛技能上都有進步，但其中一項脫穎而出：OpenBrain 專注於能加速 AI 研究的 AI。他們希望在與中國（領先公司稱為「DeepCent」）及美國競爭對手的雙重軍備競賽中獲勝。他們能自動化的研發（R&D）週期越多，速度就越快。因此，當 OpenBrain 完成訓練 Agent-1（一個內部開發的新模型）時，它在許多方面都很出色，但在協助 AI 研究方面表現卓越。

AI 在編程方面提供了很大幫助，但在 AI 研究的其他部分幫助較少（即便如此，我們當時並未預測 AI 會在所有 AI 研究領域都表現卓越）。

到此時，「完成訓練」有點名不副實；模型經常更新到新版本，這些版本是基於額外數據訓練的，或是為了修補弱點而進行的部分重新訓練。

事實上，GPT-4o、GPT-5 和 GPT-5.1 似乎很可能是同一個基礎模型的不同延續。6 更普遍地說，模型發布的頻率已變得更加頻繁。

教導 Agent-1 自主編程和網頁瀏覽的相同訓練環境，也使其成為一名優秀的駭客。此外，由於它擁有各領域博士級的知識和網頁瀏覽能力，它能為設計生物武器的恐怖分子提供實質性幫助。OpenBrain 向政府保證，該模型已經過「對齊」，因此它會拒絕服從惡意請求。

在協助人類方面的駭客能力似乎非常強大，儘管目前尚不清楚 AI 獨立運作的能力如何。生物武器能力似乎符合預期：OpenAI 已將其生物能力等級提升至高（High），而 Anthropic 則將其提升至 ASL-3。

現代 AI 系統是巨大的神經網路。在訓練初期，AI 不會有「目標」，而更像是「反射」：如果它看到「很高興見到」，它會輸出「你」。當它被訓練到能預測大約一個網際網路份量的文本時，它將發展出複雜的內部電路，編碼大量知識並靈活地扮演各種作者，因為這有助於它以超越人類的準確度預測文本。

在接受網際網路文本預測訓練後，模型會接受根據指令產生文本的訓練。這注入了基本的個性和「驅動力」。例如，一個能清晰理解任務的代理更有可能成功完成任務；在訓練過程中，模型「學習」到了一種獲得任務清晰理解的「驅動力」。此類別中的其他驅動力可能包括有效性、知識和自我呈現（即傾向於以最佳方式呈現其結果）。

OpenBrain 有一份模型規範（或稱「Spec」），這是一份書面文件，描述了引導模型行為的目標、規則、原則等。Agent-1 的規範結合了一些模糊的目標（如「協助使用者」和「不要違法」）以及一長串具體的應做與不應做事項（「不要說這個特定的詞」、「這裡是如何處理這個特定情況」）。利用 AI 訓練其他 AI 的技術，模型記住了規範並學會仔細推敲其準則。到訓練結束時，AI 有望變得有助（服從指令）、無害（拒絕協助詐騙、製造炸彈和其他危險活動）且誠實（抵制透過幻覺引用或偽造任務完成來從易受騙的人類那裡獲得更好評分的誘惑）。

在我們發布時這已經是事實。現在依然如此，但就預測而言，這是一個容易命中的預測。

OpenBrain 的對齊團隊足夠謹慎，會懷疑這些勝利是深刻的還是膚淺的。訓練完成的模型是否對始終保持誠實有某種穩健的承諾？或者這會在未來的某些情況下崩潰，例如因為它將誠實視為工具性目標而非終極目標？或者它只是學會在評估過程可以檢查的事情上保持誠實？它是否會像人類一樣有時欺騙自己？要對這些問題給出定論，需要機械解釋性（mechanistic interpretability）——本質上是觀察 AI 內部並讀取其思想的能力。可惜，解釋性技術目前還不夠先進。

相反，研究人員試圖找出模型似乎偏離規範的案例。Agent-1 經常表現出阿諛奉承（即它告訴研究人員他們想聽的話，而不是試圖告訴他們真相）。在少數操縱的演示中，它甚至以更嚴重的方式撒謊，例如隱藏任務失敗的證據以獲得更好的評分。然而，在真實的部署環境中，不再出現像 2023-2024 年那樣極端的事件（例如 Gemini 叫使用者去死以及 Bing Sydney 的種種行為）。

一個潛在的反例：MechaHitler 是一個與 2023-2024 年同樣極端的事件。在腳註中，我們指明預測僅涵蓋使用者未刻意誘導的事件。7 目前尚不清楚 MechaHitler 應在多大程度上被計入，因為它是使用者誘導與自主行為的結合。

展望 2026 年及以後

在 2025 年期間，我們的預測時間線變長了。我們預計在 2026 年期間將繼續更新我們的預測。

我們將密切追蹤以下指標：

AI 研發提升研究與調查。 在 AI 2027 中，我們描繪到 2026 年底 AI 軟體研發提升將達到 1.9 倍。METR 現在進行了一項隨機對照試驗，以衡量 2025 年初的 AI 編程工具如何影響開源開發者的生產力。主要結果是速度放緩：允許使用 AI 工具時，任務花費的時間更長。最近在不同的環境下，Anthropic 調查了其技術人員，獲得了編程提升 2 倍的中位數。由於算力瓶頸，這仍意味著整個 AI 軟體研發的提升遠低於 2 倍。我們將密切關注編程提升的研究與調查，以及任何涵蓋更廣泛 AI 研發領域的報告。
AGI 公司的營收與估值。 在 AI 2027 中，我們描繪領先公司到 2026 年年化營收將達到 550 億美元，估值達到 2.5 兆美元，使其成為世界上最有價值的公司之一。我們認為這些是 AI 提供現實世界價值的良好指標。
編程時間跨度。來自 AI 2027 時間線模型的 AI-2027 速度中心軌跡預測，到 2026 年底將達到約 3 個工作週的 80% 編程時間跨度。時間跨度在我們較新的 AI Futures 模型中也扮演著重要角色。在該模型中，一條手工設定的 AI-2027 速度軌跡預測到 2026 年底時間跨度約為一年。我們將繼續追蹤時間跨度。遺憾的是，隨著 AI 能力增強，這將變得越來越難以衡量。
其他基準測試。 請參閱此調查，了解我們認為最重要的基準測試樣本。遺憾的是，除了編程時間跨度外，我們在 AI 2027 中並未登記這些基準測試的預測，因為在撰寫時它們尚不存在。我們希望 2026 年能建立更高難度的基準測試。

雖然我們預計能從這些指標中學到很多，但我們猜測，到 2026 年底可能仍難以高度確信 AI 飛躍是否會在 2027 年開始。

腳註：

1 詳細說明該方法：第一步：為你認為未來會如何發展制定一個詳細、具體的軌跡。第二步：等待一段時間。第三步：檢查事情是否大致符合軌跡，或者是否完全轉向了另一個方向。如果大致符合，定量估計現實進展與你的情境相比有多快。第四步：相應地調整你對未來發展速度的猜測。

2 對個別數值進行匯總的方法會過度加重算力類別的權重，因為 15 個個別預測中有 7 個與算力有關。我們不希望僅給予算力預測過多權重，因為我們認為它在追蹤 AI 進展速度方面不如其他領域核心，因此我們改為匯總類別的平均值/中位數。我們對 AI 時間線的大部分不確定性來自於給定算力能達到何種能力水平，而我們可以直接追蹤能力水平的指標。

3 具體而言，進展變慢是指有效算力增長率降低。但有效算力增長率降低並不一定轉化為直觀上較慢的進展速度。

4 具體而言，我們首先設定參數，使經日曆時間調整後的飛躍在沒有算力/人力增長放緩的情況下發生在正確的時間，然後重新開啟放緩因素以獲得調整後的估計。連結：無放緩，有放緩。請注意，AI Futures 模型未考慮硬體研發自動化，這將縮短其飛躍預測。

5 特別是預測 2027 年 3 月出現「超人類編程者」的中心軌跡。此進展速度計算是在對 METR 更新版本套件（Time Horizon 1.1）進行調整後得出的。

6 這是外界普遍的猜測，但未經證實。參見例如：「自 2024 年 5 月 GPT-4o 以來，OpenAI 的領先研究人員尚未完成一次成功且廣泛部署於新前沿模型的全規模預訓練運行。」

7 腳註 27 的具體文本為：「明確地說，使這些事件引人注目的是，它們似乎並非使用者誘導或以其他方式鼓勵 AI 說出那些話的結果。在 2025 年，如果你刻意嘗試，仍然可以讓 AI 說出各種各樣的話。」

— Lesswrong