AI未來時間線與起飛模型:2025年12月更新

AI未來時間線與起飛模型:2025年12月更新

Lesswrong·

我們更新了 AI 未來模型,用以預測自動化程式編寫與超人工智慧等里程碑,並將完全自動化編程的時間表較先前預測延後了 3 到 5 年。雖然未來充滿不確定性,但我們認為這種量化建模方法為應對 AI 發展及納入新實證數據提供了一個透明的框架。

我們已大幅升級了時間線與起飛模型!該模型預測 AI 何時會達到關鍵的能力里程碑:例如,自動化程式設計師 / AC(程式編碼的完全自動化)以及超人工智慧 / ASI(在幾乎所有認知任務上都遠超最強的人類)。本篇文章將簡要解釋該模型的工作原理,展示我們的時間線與起飛預測,並將其與我們之前的(AI 2027)模型進行比較(劇透:AI 未來模型預測達成完全程式自動化的時間比我們之前的模型晚約 3-5 年,很大程度上是因為我們對完全自動化前的 AI 研發加速持較保守的態度)。2026 年 1 月新增:關於我們的預測自 AI 2027 以來的變化說明,請參閱此處。

如果您有興趣親自操作模型,最佳方式是透過這個互動網站:aifuturesmodel.com。

如果您想跳過模型動機,直接查看工作原理說明,請點擊此處。該網站對模型有更深入的解釋(從這裡開始;請使用右側圖表作為目錄),並包含我們的預測結果。

為什麼要進行時間線與起飛建模?

未來非常難以預測。我們不認為這個模型或任何其他模型應該被完全信任。該模型考慮了我們認為最重要的動態和因素,但並未涵蓋所有內容。此外,模型中只有部分參數值是基於經驗數據的;其餘則是直覺推測。如果您不同意我們的推測,可以在上方進行修改。

儘管如此,我們認為建模工作至關重要。我們的整體觀點是權衡了許多考量、因素、論點等的結果;模型是一種透明且明確地進行權衡的方式,而不是僅在我們腦中隱晦地運作。透過閱讀我們的模型,您可以了解我們為何持有這些觀點、哪些論點和趨勢對我們最為重要等。

未來充滿不確定性,但我們不應只是坐等它的到來。如果我們嘗試預測會發生什麼,如果我們關注趨勢並進行推演,如果我們建立底層動態的模型,那麼我們就能更好地掌握可能發生的情況,並在事情發生時減少措手不及。我們也能更好地將未來的經驗數據納入我們的預測中。

事實上,與我們發布 AI 2027(2025 年 4 月)時的時間線模型相比,我們對此模型所做的改進,導致我們對完全程式自動化的中位數預測推遲了約 3-5 年。這主要源於我們改進了對 AI 研發自動化的建模。這些建模上的改進對我們觀點產生的影響,比我們觀察到的新經驗證據還要大。您可以在下文閱讀更多關於這一轉變的內容。

為什麼選擇我們的建模方法?與其他方法的比較

AGI[1] 時間線預測方法

信任專家

遺憾的是,專家之間完全沒有共識,而且大多數專家似乎並未對 AGI 預測進行深入思考(例如,2023 年的一項調查觀察到巨大的框架效應,取決於詢問的是特定年份達成里程碑的機率,還是詢問對應百分位數的年份)。那項針對 AI 學者的 2023 年調查得出的 AGI 中位數為 2047 年或 2116 年,具體取決於定義。[2] 此外,Metaculus 和 Manifold 市場的聚合預測估計到 2030 年有 50% 的機率。至於技術開發者,他們往往更為樂觀;其中最極端的(Anthropic 和 OpenAI)說法是 2027 年和 2028 年。關於舊預測及其表現的調查,請參閱此處。

鑑於專家意見分歧且大多未深入思考 AGI 預測,我們認為努力形成自己的預測非常重要。

基於論點的直覺

目前的範式能擴展到 AGI 嗎?它是否缺乏某些重要的東西,如常識、真正的原創思維或在線/持續學習等?這類問題非常重要且數量繁多,無法在此一一列舉。這種方法的運作方式是每個人吸收大量的論點和考量,然後自行判斷哪些論點合理以及如何權衡。這個過程本質上涉及直覺/主觀判斷,這也是我們將其標記為「直覺」的原因。

這並非貶低它!我們認為任何稱職的 AI 預測者都必須參與這類論證,而且通常來說,你了解的事實越多、考慮和評估的論點越多,你的直覺/感覺/判斷就會越準確。此外,相關地,你對於使用哪些模型以及對其信任程度的判斷也會變得更好。我們自己權衡各方因素後的觀點僅部分基於我們所做的建模;它們同樣受到直覺的影響。

但我們認為將定量模型納入預測有巨大好處:如果不使用定量框架,很難將這麼多考量匯總成一個整體觀點。我們還發現,定量模型有助於確定哪些論點最值得關注。我們的最佳推測是,總體而言,透過定量趨勢推演進行的預測,其歷史記錄比單純依靠直覺更好。

營收推演

簡單的想法:推演 AI 營收,直到其佔據世界 GDP 的大部分。當然,這有些荒謬;以往每個快速增長的科技領域最終都會進入平台期……話雖如此,AI 似乎可能是個例外,因為原則上 AI 可以做任何事情。既然 AI 已成為一個主要產業,我們認為這種方法提供了非零的證據。根據 Epoch 的數據集,領先的 AI 公司營收目前約為 200 億美元,且每年增長約 4.1 倍。這種簡單的推演將在 2031 年底左右達到 100 兆美元的年化營收。[3]

我們在權衡各方觀點時會參考營收推演,但另一方面,營收趨勢隨時會變,我們希望預測其變化的底層驅動力。此外,目前尚不清楚什麼樣的營收門檻才算達到 AGI。因此,我們希望專門推演 AI 的能力。

以大腦為基準的算力推演

基本思路是以人類大腦為基準,估計達成 AGI 需要多少算力。然後預測當我們擁有那麼多算力時,AGI 就會實現。這種方法經歷了幾次迭代:

  1. Hans Moravec、Ray Kurzweil 和 Shane Legg 開創了這種方法,根據人類大腦每秒執行的操作次數進行預測。Moravec 在 1988 年預測 AGI 將於 2010 年實現,隨後在 1999 年修正為 2040 年。Kurzweil 和 Legg 都在 2000 年左右預測 AGI 將於 2020 年代後期實現。[4]
  2. Ajeya Cotra 在 2020 年的生物錨點(biological anchors)報告中,改為根據訓練人類大腦所需的算力來預測 AGI[5]。Cotra 還估計了演算法進步的速度,將其轉換為等效的訓練算力增長,得出「有效算力」。該報告預測的中位數為 2050 年。
  3. Davidson 的完全起飛模型(FTM)和 Epoch 的 GATE 使用了與生物錨點相同的方法來確定 AGI 訓練算力需求,但他們還模擬了 AI 研發自動化將如何縮短時間線。他們透過將 AI 軟硬體研發拆分為多項任務,預測從 20% 任務自動化到 100% 自動化之間的有效算力差距。任務自動化的百分比,連同實驗算力和自動化算力,決定了 AI 研發投入的規模。這些投入透過半內生增長模型轉換為軟體效率的進步。軟體效率隨後與訓練算力相乘,得出有效算力。

在 FTM 創建時,根據 Davidson 選擇的參數設置,它預測 AGI 將於 2040 年實現。但算力和演算法的進步都比他們預期的要快。當 FTM 根據這些新數據進行更新時,它得出的中位數縮短至 2020 年代後期或 2030 年代初期。同時,根據 GATE 的中位數參數,它預測 AGI 將於 2034 年實現。

總體而言,這種預測方法在我們看來有著令人驚訝的良好記錄:特別是 Moravec、Kurzweil 和 Legg 在很久以前做出的預測,相對於當時同時代人的看法,現在看來相當穩健。我們的模型也延續了這些模型,對訓練算力的擴展進行建模,儘管在我們的大多數模擬中,通往 AGI 的大部分進展來自於軟體。

能力基準趨勢推演

這就是我們的方法!我們覺得現在到了 2025 年,關於 AGI 有效算力需求的證據,比與人類大腦的比較更為充分:具體來說,我們可以推演 AI 在基準測試(benchmarks)上的表現。這就是我們模型中時間線部分的工作方式。我們透過推演 METR 的程式設計時間跨度套件(METR-HRS)來設定 AGI 所需的有效算力。

我們認為這非常出色。基準測試趨勢有時會中斷,且基準測試只是現實世界能力的代理指標,但是……在我們看來,METR-HRS 是目前可用於推演極高性能 AI 的最佳基準。我們認為將這條直線推向未來至少幾年是合理的。[6]

METR 本身對此進行了簡單版本的推演,假設時間跨度在日曆時間上呈指數級增長。但這並未考慮到 AI 研發自動化、人類勞動力或算力增長的變化,或是時間跨度翻倍在更高水平時變得更難或更容易的可能性。[7]

我們之前的時間線模型考慮了所有這些因素,儘管比我們新的 AI 未來模型更為粗略。我們之前使用中位數參數的模型預測……

Lesswrong

相關文章

  1. AI未來模型:2025年12月更新(針對AI 2027預測)

    Hacker News · 4 個月前

  2. 研究筆記:更簡化的AI時間線模型預測約2032年實現99%的AI研發自動化

    2 個月前

  3. 2026年第一季 AI 時間線更新:通往通用人工智慧的時程縮短

    20 天前

  4. 評估AI 2027的2025年預測

    2 個月前

  5. 回應titotal對我們AI 2027時間線模型的批評

    4 個月前