newsence

第 37 手之後的那一天

Lesswrong·25 天前

我將 AlphaGo 的第 37 手視為如同 9/11 事件般的歷史轉折點,那一刻我意識到人類從此開始與一種非人的異質智慧共同生活在地球上。

當第一架被劫持的飛機撞上世界貿易中心第一座塔樓時,我剛滿 21 歲幾個月。當時我正開車去上班,聽著廣播(那是當時的流行方式)。我完全想不通飛機到底怎麼會撞上塔樓。飛行員喝醉了嗎?他到底是怎麼飛到紐約市中心的?我腦海中想像的是一架塞斯納(Cessna)小飛機,因為客機撞進大樓的想法在當時簡直是不可想像的。當第二架飛機撞擊時,我才剛開始意識到:「等等……他們說的是那種大型商用客機嗎?」在那一刻,就像晶體突然凝結一樣,我意識到這是一場襲擊,而且將會發生戰爭。我足夠了解我的國家,知道這必然會導致軍事行動。也許,僅僅是也許,我們能避免戰爭。

當我進辦公室時,每個人都圍在一位同事帶來的個人小電視旁(那時還沒有直播串流)。那是我第一次看到畫面,看到塔樓冒出的濃煙。當我們看著現場直播時,四周是一片沉痛的交談聲。沒人工作。老闆們也和我們待在一起。他們要如何控制那場大火?在那之前會有多少人死在上面?

當第一座塔樓開始倒塌時,全屋子的人都倒吸了一口氣。我們像是一個整體般同時從螢幕前退縮。死一般的寂靜。有人開始哭泣。我們都看過《摩天樓大火》之類的電影,我們以為這就是那樣的情況。我們甚至從未想像過整座塔樓會直接倒塌,壓碎所有人。這就是一種令人作嘔的巨大變故帶來的感覺。^([1]) 現在所有目光都轉向了第二座塔樓。這座能撐住嗎?突然間,撤離的速度成了唯一重要的事情。

原本僅存的一點避免戰爭的機會,現在已徹底化為烏有。

我們都被准許提前下班。離開辦公室時,我進入了一個與我醒來時完全不同的世界。這一天的影響是驚人的。沒人知道世界會如何變得不同。我們甚至還不知道到底發生了什麼。但世界將永遠被劃分為這一天之前和這一天之後。歷史上很少有如此突然、尖銳的轉折點。一場在一天之內發生的革命。我目睹了它的發生。我們所有人一起目睹了它的發生。

我終於明白了為什麼我的長輩們對於觀看尼爾·阿姆斯壯在月球上行走有著如此深刻的記憶。對我來說,那只是歷史上的另一個日期。我的一生中,一直都有人在太空穿梭,月球上也一直有美國國旗。這是一個背景事實。但對他們來說,那是人類歷史上史無前例的一刻,標誌著永久且徹底的改變。而他們都在那一刻共同經歷了這一切。

AlphaGo

從我青少年時期起,電腦就在西洋棋上擊敗人類了。這是一項令人印象深刻的工程成就,但也是可以理解的。西洋棋基本上可以用前瞻搜索演算法以機械化的方式「破解」。我們這些在 2010 年代中期關注人工智慧的人,當時都在關注一個名為「AlphaGo」的程式。它由 Google DeepMind 運作,據說是一台能把圍棋下得非常好的機器。他們想透過挑戰當代最強的圍棋選手來證明這一點。

接下來的部分是憑記憶寫的,如果細節有誤請見諒。

圍棋的特點是潛在步數的空間擴張得太快,搜索演算法根本無法奏效。我自己幾乎沒下過圍棋,對它了解不多。但在人類看來,棋手必須對棋盤狀態的「意義」以及一步棋如何改變局勢有一種心理表徵。人們普遍認為這門遊戲需要一種根本性的直覺掌握,而人類需要經過多年的高強度對弈才能培養出這種直覺。人類無法將這種直覺程式化到機器中。所以 AlphaGo 團隊並沒有嘗試這樣做。相反地,他們創造了一個數位大腦,用數字代替神經元,透過改變這些數字來「學習」。他們讓 AlphaGo 與自己進行了數百萬局對弈,每局結束後根據表現微調數字,邊下邊「學習」。沒有任何公式或演算法可以解釋為什麼 AlphaGo 會選擇下一步棋。它只是針對棋盤狀態進行「思考」,然後產生一步棋。

2016 年 3 月,世界頂尖圍棋選手之一李世乭在電視轉播的五局比賽中對陣 AlphaGo。如果 AlphaGo 僅僅是擊敗了他,這仍會是 AI 歷史上的分水嶺。這將證明這個數位大腦以某種方式編碼了對遊戲的理解。它在這個領域擁有類似直覺的東西。這已經是奇蹟了。這是人們曾說過機器不可能做到的事。我們中的一些人已經預料到這可能會發生。我們對此感到興奮。但我們中很少有人準備好迎接「第 37 手」。

第 37 手時刻

在 3 月 9 日的第二局比賽中,AlphaGo 在一個人類絕對不會落子的地方下了一棋。這就是現在著名的「第 37 手」。評論員們都驚呆了。觀看直播和在線聊天的人懷疑 AlphaGo 出現了故障並報錯。李世乭站起身走開了。他花了十五分鐘苦思那一手棋。沒人知道發生了什麼。這不僅是一步人類不會下的棋,這是一步人類無法想像的棋。這要麼是最令人尷尬的失誤,要麼就是證明人類不再是圍棋思維的巔峰。而找出答案的唯一方法,就是讓李世乭全力以赴,用他平生最強的實力去測試這台機器的直覺。

事實證明,第 37 手是超越人類的一步。AlphaGo 贏得了那場比賽。事後李世乭表示他感到「無力」,AlphaGo 是「一個無法被擊敗的實體」。他大部分是對的——他在五局比賽中的第四局擊敗了它。那場勝利使他成為唯一一位在正式比賽中擊敗過 AlphaGo 的人類。^([2])

在第 37 手之前,AI 發展的一切對我來說仍感覺像是理論。接著我看到了一個怪異的行為,一個外星心智的行為,它莫名其妙地導致了不可避免的失敗。這東西理解了一些我們無法理解的事情。它擁有一種我們無力看透的洞察力。我意識到,我們現在正與一個「外星智慧」共存於這個星球上。一個以不同方式思考的新心智,它能思考我們無法思考的事情。

它當時仍然極其受限。在圍棋領域之外毫無力量。然而,它終究是一個新的心智,而且再也回不去了。以前我們沒有與外星心智共享地球,現在我們有了,而 3 月 9 日的第 37 手就是每個人都見證了這一點的日子。你無法回到你離開時的那個世界。^([3])

隔天

在 9/11 襲擊發生的十年後,我開始理解長輩經驗中的另一個面向:缺乏共同的背景。我的生命中沒有「登月前」的時期,我不記得那之前的世界,也沒有見證過那個轉折點。到了 2010 年代中期,我認識了越來越多對 9/11 之前的世界沒有真實記憶的成年人。事件發生時他們還太小,等到他們更大的世界模型形成時,9/11 已經是一個歷史事實。他們唯一知道的世界,就是那個已經被改變過的世界。他們感受不到那種變化。

變老的過程充滿了這樣的時刻,你會突然有一種深刻的啟示,並意識到:「噢……原來他們一直以來的感受是這樣的。」我明白為什麼他們沒有真正告訴過我,因為這在言語上是無法真正傳達的。這是必須親身經歷的事情。相反地,你觀察著年輕人並等待著,因為你知道最終他們會明白,然後他們也會產生那種「噢……原來他們一直以來的感受是這樣的」感覺。只有時間能帶來這一切。

即使在地球舞台發生了如此巨大的變革之後,時間依然流逝。生活在繼續,在個人層面上,歷史分裂事件發生前的一天與發生後的一天並沒有太大區別。即使人類的一切都改變了,對個人來說卻沒什麼改變。我還是得付房租、刷牙。然而,色調已經轉變,背景音樂已經變調。你能感覺到世界不同了。奇怪的是,新一代人只能感受到他們進入世界後的世界狀態。奇怪的是,我永遠無法感受到我出生之前的世界狀態。我覺得這不公平。

在第 37 手發生的十年後,我現在經常遇到那些沒有生活在「無外星心智世界」中的成年人。這些成年人沒有親眼目睹一個由數字組成的全新大腦,在一個不可思議的位置落子,為未來開闢出一條通往勝利的道路。他們仍生活在被賦予的預設世界中。我希望他們能盡可能深地沉浸在其中的滋味。當你還不知道歷史的滋味會如何變化時,很難知道該珍惜什麼。我希望他們能花點時間,也許每年幾分鐘,去思考在「以前的時代」世界是多麼奇妙——那時全世界唯一的思考者,只有血肉之軀的人類。

參與討論

https://lesswrong.com/posts/Amvp33TB8JSi6HA8u/the-day-after-move-37