newsence

在強力預設下,人工超級智能將終結自由民主

Lesswrong·大約 6 小時前

自由民主的存續依賴於權力平衡,而人工超級智能本質上將破壞這種平衡,無論由誰率先開發,都極可能導致全球性的獨裁統治。除非人工智慧的發展極其緩慢,或者超級智能本身被設計為保護民主價值,否則這種絕對權力的集中將使現有的政府約束機制形同虛設。

轉載自我的網站

自由民主制度——擁有法治、對政府權力的約束以及享有投票權的公民——其存在依賴於一種權力平衡,即單個惡意行為者無法造成過大的破壞。人工超智能(ASI)即便在對齊(aligned)的情況下,預設也會打破這種平衡。

這並非是誰開發出 ASI 的問題。無論第一個 ASI 是由極權國家還是民主國家開發,最終結果——在極強的預設情況下——都將是一個「事實上的」全球獨裁政權。

核心問題在於,誰控制了 ASI,誰就能擊敗任何反對勢力。想像一個情景,(假設)DARPA 開發出了第一個超智能
^([1])
,而 ASI 訓練計畫的負責人決定奪取政權。任何人能對此做什麼嗎?

如果總統命令軍隊佔領 DARPA 的數據中心,ASI 可以擊敗軍隊。
^([2])

如果國會發布指令要求 DARPA 必須移交 ASI 的控制權,DARPA 可以拒絕,而國會的應對手段甚至比總統還要少。

如果自由民主制度繼續存在,那也僅僅是出於 ASI 控制者的恩賜。

有兩種看似合理的情景,有機會避免極權主義的結果:

  • AI 能力進展緩慢。

  • ASI 本身保護自由民主。

我將依序討論這兩點。

如果 AI 能力進展緩慢會怎樣?

如果滿足以下兩個條件,我們就有機會避免「事實上的」極權主義:

  • 在 AI 開發的每一步,AI 的控制權都被廣泛分配。

  • 在每一步中,下一代 AI 的強度不足以壓倒上一代 AI 的所有副本。

廣泛分配 AI 是困難的——當今的前沿大型語言模型(LLM)需要超級電腦才能運行,其硬體需求隨每一代更迭而變得日益昂貴,且 AI 開發者有強烈的動機反對分配。此外,分配 AI 會加劇失調(misalignment)和濫用的風險,這項權衡可能並不值得。

我們不知道技術飛躍(takeoff)會是快還是慢;將賭注押在「慢速飛躍」上是一場極其冒險的行動。前沿 AI 公司正竭盡全力快速構建 ASI,並明確希望讓 AI 實現遞迴自我改進。如果他們成功了,很難看出自由民主制度將如何自我保存。

如果 ASI 本身保護自由民主會怎樣?

有一種可以想像的情景:一個對齊的 ASI 維護著自由民主,並拒絕任何會侵犯公民自由的命令。

我在上文寫道:

如果自由民主制度繼續存在,那也僅僅是出於 ASI 控制者的恩賜。

這依然成立,但在這種情況下,「控制 ASI 的人」將是 ASI 本身。如果它是以透明的方式對齊的,那麼或許我們可以確信它真的會維護民主。

即便在這種情景下,仍有一小群人控制著 ASI 的訓練方式。希望在訓練期間,這些人還沒有足夠的權力來阻止監督。例如,或許法律規定:(1) AI 開發者必須公開其訓練過程並接受審計,且 (2) 訓練過程必須引導 AI 重視自由民主。目前完全不清楚這些法律將如何運作、我們如何獲得這些法律,或者如何執行它們;但至少這種結果在可能性上是可以想像的。

這種情景帶來了一些額外的挑戰:

  • ASI 在保護自由民主方面必須是不可修正的(incorrigible)。這限制了我們能使用的對齊方案類型,使得對齊問題更難解決。不可修正意味著如果你在設計 AI 時犯了錯,你就無法修復它。

  • 我們必須確保一個不可更改的「保護自由民主」指令不會產生嚴重的意外後果——而預設情況下,它很可能會產生(想想艾西莫夫的機器人三定律)。

  • AI 的進展必須足夠緩慢,以便在為時已晚之前建立適當的法律或監管;或者我們必須信任領先的 AI 開發者會將適當的價值觀嵌入其 ASI 中。

自由民主並非真正的目標

俗話說,民主是除了所有其他嘗試過的政府形式之外最糟糕的形式。我們不想要民主;我們想要的是一種「真正好」的政府形式(希望有一天我們能弄清楚那是什麼)。恐懼並不在於 ASI 會用那些真正好的政府形式取代民主,而在於我們將迎來極權主義。

自由民主勝過極權主義。但「鎖定」自由民主會阻止我們獲得任何真正好的政府系統。這是一個兩難困境。

也許我們可以避免極權主義,但目前沒有明確的路徑

這篇文章並非斷言 ASI 「一定會」終結自由民主。它斷言的是,在「強預設」下,ASI 將終結自由民主(即便在解決了對齊問題的前提下)。或許有方法可以避免這個問題——我勾勒了兩條可能的路徑。但這些草案仍需要解決許多子問題;我不指望事情在預設情況下會進展順利。

這些來源論證的是「失調」的 ASI 可能擊敗人類,而我的主張是「對齊」的 ASI 可以擊敗任何反對勢力,但兩者的論據是相同的。 ↩︎

參與討論

https://lesswrong.com/posts/gmYTwEyvEsCyhESwh/by-strong-default-asi-will-end-liberal-democracy