圍棋棋手如何在 AI 面前自我削弱

Lesswrong·大約 5 小時前

本文探討了人工智慧對圍棋界的社會學影響，重點關注廣泛存在的違規使用 AI 現象以及執法機制的缺失如何改變了這項運動的文化與棋手的心理。

這篇文章是 MATS 9.1 擴展計畫的一部分，由 Richard Ngo 指導。

2016 年 3 月 9 日至 15 日，全球的圍棋棋手們熬夜見證了他們的領域淪陷於人工智慧（AI）。Google DeepMind 的 AlphaGo 以 4 比 1 的壓倒性比分，擊敗了當時公認的世界最強棋手李世乭。

這起事件「震撼」了圍棋界，但其對文化的影響最初並不明確。以西洋棋為例，電腦並未實質性地自動化取代人類的工作。在網路時代，人類西洋棋作為一種準電子競技蓬勃發展，而每年的電腦西洋棋錦標賽在網路上同時關注的宅男不過數百人。事實證明，遊戲的文化和經濟價值並非來自頂尖表現的抽象美感，而是來自人類的戲劇性與參與感。事實上，圍棋似乎也複製了這種模式。解說直播可能會加入 AI 評估條來為觀眾提供背景資訊；圍棋老師可能會在教學材料中加入一些有趣的 AI 新變化。但圍棋的文化實踐似乎基本上未受影響。

然而，2018 年初，歐洲開始出現不和諧的早期跡象。當時歐洲團體錦標賽（ETC）的線上裁判指控一名棋手 Carlo Metta 在對局中非法使用 AI。他的成績被取消，並被禁止繼續參加該賽事。在該場爭議對局進行時，基於 AlphaGo 論文的開源引擎（如 Leela Zero）才出現約一個月。然而，其前身 Leela 0.11 已經廣泛可用，且已知其水平足以匹配 Metta 所面對的歐洲頂尖棋手。指控者聲稱，他的下法與這款 AI 偏好的招式過於相似。此外，他在實體棋盤（OTB）上的表現與 AI 的吻合度顯著低於其線上對局，這也被認為十分可疑。

對控方不利的是，他們的報告方式既不透明又草率。這點可以從以下事實得到證明：他們調查結果的最佳彙整，竟然是我上面連結的那個草率的 Facebook 貼文串。這一點連同證據的間接性質，在同一貼文串中受到了社群成員的批評。Metta 的隊友和朋友也站出來公開為他辯護。他們的說辭之所以奏效，部分原因在於大眾對 AI 作弊者的污名化與蔑視；諷刺的是，由於指控被認為極其嚴重，反而讓針對 Metta 的案例顯得不公平且不成比例。最終，義大利隊提出上訴並獲勝，Carlo Metta 被正式宣告無罪。

在非義大利裔的歐洲棋手中，關於 Metta 自 2018 年以來在 ETC 幾乎每場比賽都使用 AI 的說法已變得幾乎無可爭議，尤其是考慮到後續的發展。在 2017/2018 賽季，他的勝率大約一半，當時可能對陣與軟體水平相當的對手使用了 Leela 0.11。同年，義大利隊被降級到較低級別的聯賽，那裡基本上沒有歐洲圍棋界的權勢人物會去關注。這恰逢 Leela Zero（一款真正的超人類開源圍棋引擎）普及化。Metta 在 2018/2019 賽季對陣與他實體水平相當的對手時取得了 9 勝 0 負的戰績，2019/2020 賽季取得 9 勝 1 負，隨後幾年更在 26 場比賽中贏了 25 場^([1])。他在這最後一段連勝中唯一的敗績，是在一場被強制要求在攝像頭監控下進行的比賽。在此期間，他的實體棋力始終停滯不前。

在這一點上，若仍認為 Metta 是「清白」的，代表近乎絕對地拒絕基於間接證據的定罪。我並非要在這裡訴訟這個問題，但在此我可以很放心地假設 Metta 在這些比賽中經常使用 AI。然而，這只是我們故事的開端，因為它說明了圍棋中使用 AI 的社會學關鍵點。首先，取消其資格的公開公告及隨後的討論，將 AI 作弊者妖魔化（事後證明是不正確的）為異常不名譽且邪惡的人。其次，他開創了一個先例：AI 使用者基本上永遠不會受到懲罰，無論他們的作弊行為在調查中多麼明顯。他們總是可以讓盟友大肆喧嘩，向主辦方施壓以撤銷決定。這些特徵使得指控他人作弊的社會成本極高，並且讓錦標賽主辦方和公平競賽委員會產生了一種徒勞感。由於幾乎完全缺乏有效的懲戒機制，在歐洲線上賽事中作弊變得輕而易舉。

我於 2020 年開始擔任圍棋老師，為一家因應疫情需求而重新成立的線上圍棋學校製作技術性對局評論。我們並未預料到作弊會成為學校的主要問題。雖然非法使用 AI 已經是日益增長的線上賽事生態系統中眾所周知的問題，但我們沒想到它會影響到我們不計分、無獎金的教學聯賽。相反地，我們很快就意識到，有些學生下出的對局比我們這些老師所能期望達到的水平還要好。有時，AI 的使用痕跡極其明顯，因為雙方在整場對局中都走出了 AI 的首選招式。我現在估計，大約有一半的學生至少在一場比賽中使用過 AI，而十分之一是慣性使用者。我們最初對觀察到的現象感到困惑。棋手僅僅為了讓 AI 代替自己獲勝而放棄練習對局，這在邏輯上說不通。我們也難以決定如何處理這個問題，且出於與大多數賽事主辦方大致相同的理由，我們不願正面解決它。

大約在同一時間，我被要求調查一名有前途的年輕棋手的線上對局，一位朋友懷疑他在青少年聯賽中使用了 AI。就像在圍棋學校一樣，我驚訝於作弊是多麼容易被偵測到，因為幾乎所有的孩子都在互相對局時經常使用 AI。這起事件和其他類似事件讓我逐漸意識到，非法使用 AI 在圍棋界已是普遍現象。幸運的是，這種模式並未推廣到 COVID 期間舉行的真正重要或負盛名的線上錦標賽。象徵性的攝像頭監控——對於專注的作弊者來說很容易規避——似乎足以遏制幾乎所有的作弊行為，而威脅或對「公平競賽委員會」無力的引用卻做不到這一點。這讓我想起 Metta 往往只有在攝像頭監控下（或面對另一位 AI 使用者時）才會在線上比賽中落敗^([2])。

回到我和圍棋學校那些倒楣的同事身上，我們最初決定採取冷處理，暗示可疑的對局「好到無法評論」，並強調我們無法幫助「在這種水平」下棋的學生。學生們領會了意思，隨後我們很幸運地得到了一些私下的作弊坦白；多年來，我追蹤並訪談了許多使用 AI 的學生，包括一些最初沒有主動交代的學生。作弊者迷人且刺激的典型形象是利用隱蔽、複雜的方法獲取外部資訊，並詐取獎金或名譽頭銜。然而，我們從眾多作弊案例和棋手坦白中了解到，盲目的好奇心和懶惰才是我們學校使用 AI 的主導原因。我們的學生通常打算下一盤正常的圍棋，但會卡在某個特別困難或惱人的棋步上；最終，他們好奇的目光會飄向第二個螢幕——那裡通常本來就運行著 AI 軟體——然後他們會像偷看有趣謎題或作業答案一樣查看答案。人們提到的另一個使用 AI 的原因是為了維護或提升自己在學校社群中的形象。有些人不想顯得無能，會採用一些策略，例如只下那些根據電腦評估損失不超過「n」點期望值的棋步。

這些原因對我們來說都不意外；我們在揣摩學生奇怪行為時早已想到了大部分。然而，令我個人感到震驚的是，學生們如何將他們使用 AI 的行為概念化。在這方面，Carlo Metta 也是一個極具預測性的案例。在 Reddit 上討論他被禁賽的原始貼文中，有一條來自名為「carlo_metta」用戶的評論，寫道：

我從不讓 Leela 選擇棋步。我只是自己決定哪一步更好，出於這個原因，我認為我可以透過 Leela 找到自己的風格。圍棋是一門藝術，Leela 幫助我表達我的技巧。

那個帳號是個免洗帳號，很可能是個反串。然而，當我聽到我們作弊的學生口中說出完全相同的論點時，我不禁想起了這條評論。每個學生敘述的核心部分都是：儘管使用了 AI，他們仍保留了對產出的藝術控制權，並能行使自主權為自己思考和進步。對他們來說，AI 就像是一個幫助他們實現潛在能力或藝術感知的工具。

AI 使用者永遠不會發現自己其實「沒搞懂」

歐陸國家的數學大學學位以其殘酷著稱，畢業率通常只有 10-15%。那 90% 的人中，許多人幾乎立即退學，但有些人會堅持完第一年。這些人通常能跟上證明和練習修正的每一個微小步驟，這給了他們虛假的希望。然而，他們往往難以看清材料的「大局」動機，且他們的希望最終很可能會破滅。我曾在一場關於代數基礎和矩陣計算的期末考（第三次補考）中，意外目睹了一場集體崩潰。我參加考試是為了提高年初的成績，但沒有其他稍微稱職的人會費心這麼做。在考場外，我聽著其他四十多名學生的閒聊，聽到諸如「我討厭證明但我會做練習題」或「為了這題我背下了所有的矩陣乘法法則」之類的話，心裡感到一陣寒意。考試本身非常不按牌理出牌；教授顯然認為我們已經受夠了操作矩陣，轉而考了一系列雜亂的簡單代數問題，對我來說，這些問題傳達出的訊息是：「如果你到現在已經學會像數學家一樣思考，這些是你應該能做的基本練習」。

出場時的氣氛混合著沮喪與憤怒。人們在具體層面上抱怨考試，通常是抱怨考試內容太冷門或與教材無關。然而，背後有更根本的原因。人們帶著一袋袋半生不熟的啟發式方法、手抄的練習題和證明來到考場。那場考試讓他們直面一個事實：他們的記憶輔助工具永遠無法幫助他們「搞懂」。我想我再也沒見過他們中的任何一個人。

圍棋 AI 的使用者群體——包括那些在線上比賽中作弊的人，以及那些僅在賽後用 AI 覆盤的人——正處於那場考試的前夕。他們出於盲目的好奇心啟動電腦，隨著宇宙的真理在眼前飄過而消極地點頭。他們並沒有多理解這些見解，僅僅是因為他們可以點擊那些精妙的棋步。人們總是低估了當解決方案不再擺在面前時，自己會變得多麼迷茫。這種對 AI 使用的看法向我解釋了為什麼攝像頭監控對線上作弊如此有效。由於使用 AI 通常是一種自我貶低和失去權能的行為——一種讓自己屈從於環境誘因梯度的行為——它從根本上與「憑藉自身資源克服微小障礙」的美學相矛盾。

AI 使用者展現出的控制錯覺，以一種陰險的方式與他們的失去權能相互作用。它促成了一個圍棋棋手社會，讓他們在文化中的參與被自動化取代。此外，他們對此感到如此無力，以至於建立了內在的心理機制，防止自己意識到自己的過時。這種機制甚至會破壞對他人使用 AI 的偵測。人們往往會對某場比賽涉及 AI 的可能性給出過於保守的估計。我認為這是因為他們通常會諮詢自己的 AI 來檢查可疑的對局。在這樣做的過程中，他們也轉向了機器的觀點，並得出結論：在這種情況下，下出正確的 AI 棋步本來就是「自然」的事情。

我對圍棋中 AI 使用（尤其是作弊）的看法，最初表現為對從業者的厭惡。後來我轉向了一種同情和務實的態度，對待一種顯然更多是粗俗和軟弱而非邪惡的習慣。隨著時間推移，我進步到對一個放棄了大部分其聲稱所重視價值的群體感到深深的悲哀。我想透過這篇文章傳達的是：我們作為一個物種，始終低估了自己將文化、經濟和自主權拱手讓給 AI 的意願，甚至在沒有金錢誘因的情況下也是如此。為了讓這種情況發生，AI 甚至不需要超越人類。事實上，圍棋 AI 將人類棋手在文化中的角色自動化為淺薄的幻象。AI 只需要在某項任務上表現得尚可，就足以讓人類自願接受被取代。

附錄 A：不，圍棋棋手並沒有變強

對於這段悲觀獨白，我可以預見的一個反對意見是：自從 AI 廣泛可用以來，專家級圍棋棋手似乎有所進步。文化演化領域有相當數量的研究支持這一點，包括這篇論文以及同一組作者的相關論文。這些觀點受到了技術樂觀主義圈子部落格的推崇，其中一張相關圖表最近在 Twitter 上流傳。我已經寫過一篇文章分析研究中使用的數據，結論是這些數據被誤讀了。簡而言之：所有對局質量的提升都發生在第 60 手之前，也就是人類可以模仿記憶中的 AI 定式（policy）的時候。在第 60 手之後，即對局的關鍵部分，表現並未提升。要讓我相信人類的下法與 AI 出現前相比有任何實質性的變化，我必須確信棋手們對他們複製的 AI 招式有足夠深刻的理解，以便在開局結束、脫離 AI 路徑後仍能保持較高水平。目前沒有證據支持這一點。

附錄 B：為什麼這篇文章存在

這篇文章並非旨在嚴謹地證明圍棋棋手失去了權能，或仔細探討這種失去權能的形式。相反，它是為了傳達一種來自圍棋社群經驗的氛圍，我認為這可以為「逐漸失去權能」（Gradual Disempowerment）這一普遍現象提供有用的直覺。

^(^)我使用一個「氛圍編程」（vibecoded）的腳本（真諷刺！）從錦標賽網站抓取了數據，並手動驗證了大部分內容。
^(^)Metta 在 COVID 期間也經常參加（並使用 AI）ETC 之外的線上賽事。

參與討論

— Lesswrong

你的個人知識庫

圍棋棋手如何在 AI 面前自我削弱

AI 使用者永遠不會發現自己其實「沒搞懂」

附錄 A：不，圍棋棋手並沒有變強

附錄 B：為什麼這篇文章存在