AI未來時間線與起飛模型：2025年12月更新

Lesswrong·4 個月前

我們更新了 AI 未來模型，用以預測自動化程式編寫與超人工智慧等里程碑，並將完全自動化編程的時間表較先前預測延後了 3 到 5 年。雖然未來充滿不確定性，但我們認為這種量化建模方法為應對 AI 發展及納入新實證數據提供了一個透明的框架。

我們已大幅升級了時間線與起飛模型！該模型預測 AI 何時會達到關鍵的能力里程碑：例如，自動化程式設計師 / AC（程式編碼的完全自動化）以及超人工智慧 / ASI（在幾乎所有認知任務上都遠超最強的人類）。本篇文章將簡要解釋該模型的工作原理，展示我們的時間線與起飛預測，並將其與我們之前的（AI 2027）模型進行比較（劇透：AI 未來模型預測達成完全程式自動化的時間比我們之前的模型晚約 3-5 年，很大程度上是因為我們對完全自動化前的 AI 研發加速持較保守的態度）。2026 年 1 月新增：關於我們的預測自 AI 2027 以來的變化說明，請參閱此處。

如果您有興趣親自操作模型，最佳方式是透過這個互動網站：aifuturesmodel.com。

如果您想跳過模型動機，直接查看工作原理說明，請點擊此處。該網站對模型有更深入的解釋（從這裡開始；請使用右側圖表作為目錄），並包含我們的預測結果。

為什麼要進行時間線與起飛建模？

未來非常難以預測。我們不認為這個模型或任何其他模型應該被完全信任。該模型考慮了我們認為最重要的動態和因素，但並未涵蓋所有內容。此外，模型中只有部分參數值是基於經驗數據的；其餘則是直覺推測。如果您不同意我們的推測，可以在上方進行修改。

儘管如此，我們認為建模工作至關重要。我們的整體觀點是權衡了許多考量、因素、論點等的結果；模型是一種透明且明確地進行權衡的方式，而不是僅在我們腦中隱晦地運作。透過閱讀我們的模型，您可以了解我們為何持有這些觀點、哪些論點和趨勢對我們最為重要等。

未來充滿不確定性，但我們不應只是坐等它的到來。如果我們嘗試預測會發生什麼，如果我們關注趨勢並進行推演，如果我們建立底層動態的模型，那麼我們就能更好地掌握可能發生的情況，並在事情發生時減少措手不及。我們也能更好地將未來的經驗數據納入我們的預測中。

事實上，與我們發布 AI 2027（2025 年 4 月）時的時間線模型相比，我們對此模型所做的改進，導致我們對完全程式自動化的中位數預測推遲了約 3-5 年。這主要源於我們改進了對 AI 研發自動化的建模。這些建模上的改進對我們觀點產生的影響，比我們觀察到的新經驗證據還要大。您可以在下文閱讀更多關於這一轉變的內容。

為什麼選擇我們的建模方法？與其他方法的比較

AGI[1] 時間線預測方法

信任專家

遺憾的是，專家之間完全沒有共識，而且大多數專家似乎並未對 AGI 預測進行深入思考（例如，2023 年的一項調查觀察到巨大的框架效應，取決於詢問的是特定年份達成里程碑的機率，還是詢問對應百分位數的年份）。那項針對 AI 學者的 2023 年調查得出的 AGI 中位數為 2047 年或 2116 年，具體取決於定義。[2] 此外，Metaculus 和 Manifold 市場的聚合預測估計到 2030 年有 50% 的機率。至於技術開發者，他們往往更為樂觀；其中最極端的（Anthropic 和 OpenAI）說法是 2027 年和 2028 年。關於舊預測及其表現的調查，請參閱此處。

鑑於專家意見分歧且大多未深入思考 AGI 預測，我們認為努力形成自己的預測非常重要。

基於論點的直覺

目前的範式能擴展到 AGI 嗎？它是否缺乏某些重要的東西，如常識、真正的原創思維或在線/持續學習等？這類問題非常重要且數量繁多，無法在此一一列舉。這種方法的運作方式是每個人吸收大量的論點和考量，然後自行判斷哪些論點合理以及如何權衡。這個過程本質上涉及直覺/主觀判斷，這也是我們將其標記為「直覺」的原因。

這並非貶低它！我們認為任何稱職的 AI 預測者都必須參與這類論證，而且通常來說，你了解的事實越多、考慮和評估的論點越多，你的直覺/感覺/判斷就會越準確。此外，相關地，你對於使用哪些模型以及對其信任程度的判斷也會變得更好。我們自己權衡各方因素後的觀點僅部分基於我們所做的建模；它們同樣受到直覺的影響。

但我們認為將定量模型納入預測有巨大好處：如果不使用定量框架，很難將這麼多考量匯總成一個整體觀點。我們還發現，定量模型有助於確定哪些論點最值得關注。我們的最佳推測是，總體而言，透過定量趨勢推演進行的預測，其歷史記錄比單純依靠直覺更好。

營收推演

簡單的想法：推演 AI 營收，直到其佔據世界 GDP 的大部分。當然，這有些荒謬；以往每個快速增長的科技領域最終都會進入平台期……話雖如此，AI 似乎可能是個例外，因為原則上 AI 可以做任何事情。既然 AI 已成為一個主要產業，我們認為這種方法提供了非零的證據。根據 Epoch 的數據集，領先的 AI 公司營收目前約為 200 億美元，且每年增長約 4.1 倍。這種簡單的推演將在 2031 年底左右達到 100 兆美元的年化營收。[3]

我們在權衡各方觀點時會參考營收推演，但另一方面，營收趨勢隨時會變，我們希望預測其變化的底層驅動力。此外，目前尚不清楚什麼樣的營收門檻才算達到 AGI。因此，我們希望專門推演 AI 的能力。

以大腦為基準的算力推演

基本思路是以人類大腦為基準，估計達成 AGI 需要多少算力。然後預測當我們擁有那麼多算力時，AGI 就會實現。這種方法經歷了幾次迭代：

Hans Moravec、Ray Kurzweil 和 Shane Legg 開創了這種方法，根據人類大腦每秒執行的操作次數進行預測。Moravec 在 1988 年預測 AGI 將於 2010 年實現，隨後在 1999 年修正為 2040 年。Kurzweil 和 Legg 都在 2000 年左右預測 AGI 將於 2020 年代後期實現。[4]
Ajeya Cotra 在 2020 年的生物錨點（biological anchors）報告中，改為根據訓練人類大腦所需的算力來預測 AGI[5]。Cotra 還估計了演算法進步的速度，將其轉換為等效的訓練算力增長，得出「有效算力」。該報告預測的中位數為 2050 年。
Davidson 的完全起飛模型（FTM）和 Epoch 的 GATE 使用了與生物錨點相同的方法來確定 AGI 訓練算力需求，但他們還模擬了 AI 研發自動化將如何縮短時間線。他們透過將 AI 軟硬體研發拆分為多項任務，預測從 20% 任務自動化到 100% 自動化之間的有效算力差距。任務自動化的百分比，連同實驗算力和自動化算力，決定了 AI 研發投入的規模。這些投入透過半內生增長模型轉換為軟體效率的進步。軟體效率隨後與訓練算力相乘，得出有效算力。

在 FTM 創建時，根據 Davidson 選擇的參數設置，它預測 AGI 將於 2040 年實現。但算力和演算法的進步都比他們預期的要快。當 FTM 根據這些新數據進行更新時，它得出的中位數縮短至 2020 年代後期或 2030 年代初期。同時，根據 GATE 的中位數參數，它預測 AGI 將於 2034 年實現。

總體而言，這種預測方法在我們看來有著令人驚訝的良好記錄：特別是 Moravec、Kurzweil 和 Legg 在很久以前做出的預測，相對於當時同時代人的看法，現在看來相當穩健。我們的模型也延續了這些模型，對訓練算力的擴展進行建模，儘管在我們的大多數模擬中，通往 AGI 的大部分進展來自於軟體。

能力基準趨勢推演

這就是我們的方法！我們覺得現在到了 2025 年，關於 AGI 有效算力需求的證據，比與人類大腦的比較更為充分：具體來說，我們可以推演 AI 在基準測試（benchmarks）上的表現。這就是我們模型中時間線部分的工作方式。我們透過推演 METR 的程式設計時間跨度套件（METR-HRS）來設定 AGI 所需的有效算力。

我們認為這非常出色。基準測試趨勢有時會中斷，且基準測試只是現實世界能力的代理指標，但是……在我們看來，METR-HRS 是目前可用於推演極高性能 AI 的最佳基準。我們認為將這條直線推向未來至少幾年是合理的。[6]

METR 本身對此進行了簡單版本的推演，假設時間跨度在日曆時間上呈指數級增長。但這並未考慮到 AI 研發自動化、人類勞動力或算力增長的變化，或是時間跨度翻倍在更高水平時變得更難或更容易的可能性。[7]

我們之前的時間線模型考慮了所有這些因素，儘管比我們新的 AI 未來模型更為粗略。我們之前使用中位數參數的模型預測……

— Lesswrong

你的個人知識庫

AI未來時間線與起飛模型：2025年12月更新

為什麼要進行時間線與起飛建模？

為什麼選擇我們的建模方法？與其他方法的比較

AGI[1] 時間線預測方法