成為中文房間

Lesswrong·5 個月前

我在從未去過中國的情況下寫了一部以中國為背景的小說，並以此經驗挑戰了 AI 無法僅透過文本獲得深刻理解的觀點。中國讀者的正面回饋顯示，抽象推理與廣泛閱讀確實能對一個從未親身體驗過的世界建立起強大且真實的理解。

[我的小說《紅心》（Red Heart）本週以 4 美元促銷中。Daniel Kokotaijlo 非常喜歡它，而白宮 AI 政策高級顧問目前也正在閱讀此書。]

「形式符號的操作本身……僅具有語法（syntax）而無語義（semantics）。電腦所表現出的意向性，完全存在於那些編寫程式的人、使用的人、輸入訊息的人以及解釋輸出結果的人的心中。」
—— 約翰·瑟爾（John Searle），「中文房間」思想實驗的提出者

在《紅心》出版前不久，我的一位同事對我說：如果你能在沒去過中國、沒在中華文化背景下長大、也不懂中文的情況下，成功寫出一部以中國為背景、從中國視角敘述且令人信服的小說，那將是證明抽象推理和書本學習效力的重要證據。這反過來也可能關係到我們應該預期 AI 系統會有多強大、多具爆發性。

許多人（例如那些主張「AI 即普通技術」的人）認為，AI 將因缺乏與現實世界及其所有複雜系統互動的經驗而面臨重大瓶頸。他們聲稱：「是的，閱讀不熟悉的領域是可能的，但在缺乏具身、親身實踐的知識的情況下，這些詞彙只是根據純粹的統計模式而被搬弄的無意義符號。」^([1]) ChatGPT 從未去過中國，就像它從未真正「去過」任何國家一樣。它所能做的只有閱讀。^([2]) 任何心智，無論多麼快速或深邃，能否僅從抽象描述中建立起對世界深刻且強大的理解？

我不是大語言模型（LLM），兩者之間可能存在重要差異，但讓我們從證據開始。我成功了嗎？

「得知 Max 在完成這部小說之前一次都沒去過中國，讓我感到非常驚訝和印象深刻。每一章在中國發生的場景設定，都展現了對我成長國家的文化、習慣和品味的親密熟悉感，而且完全沒有那種常見的將其『異國情調化』的陷阱。我會以為這部小說是由在中國生活多年的人寫的。」
—— 吳艾力（Alexis Wu），中國歷史語言學家與翻譯家

「我現在相信你有一個在中國長大的共同作者——書中的中國細節簡直不可思議，如果你沒有中國共同作者或編輯，對於一個沒去過中國的人來說，這真的很令人佩服。」
「《紅心》是對現代中國 AI 的一次驚人且真實的描繪——既具遠見又植根於文化真相。」
—— 張三，^([3]) AI 企業資深高管

我是如何做到的？這對於「理解是否能僅從文本中建立」又暗示了什麼？

撰寫關於中國的故事

在寫這本書時，我肯定弄錯了一些事情。

在書出版前不久，由於擔心這可能是我唯一能安全訪問大陸的機會，^([4]) 我以遊客身份訪問了深圳（和香港）。《紅心》的大部分情節發生在貴州，而不是深圳所在的廣東，但貴州仍然相當接近，且在某些方面相似——尤其是濕度。整部小說中只有一處隨口提到濕度，儘管主角經常進出精心調節空調的空間！華南地區非常潮濕（至少與加州相比），對我內心的完美主義者來說，這是一個明顯的缺陷。啊！

我所知道的大多數問題都像濕度一樣——是細節的缺失，而非徹底的錯誤。我希望我在描繪時尚趨勢和審美標準方面做得更好。我希望我當時強調了街頭小販只收現金是多麼奇怪。諸如此類。

我也確信在很多地方犯了顯眼的錯誤。我寫作過程中最重要的部分之一，是找了半打中國人閱讀我的初稿，並請他們挑錯。錯誤有很多，^([5]) 而且經常出現一個中國讀者發現了另一個讀者沒發現的問題，這意味著肯定還有更多我尚未聽說的錯誤，因為合適的中國讀者還沒留下評論。（如果你是這樣的人，請在評論區或 Amazon、Goodreads 上指出來！我喜歡發現自己錯了——這是走向正確的第一步。）我了解中國後最大的收穫之一是，它是一個極其龐大且多樣化的國家（在許多方面比美國更多樣^([6])），這意味著沒有任何一個人能對真實性進行全面的檢查。

但同時，我認為我大部分都寫對了，或者至少達到了一部小說所能達到的程度。在將書發給任何中國人之前，作為 AI 研究工作的一部分，我已經閱讀了大量關於該國的資料。中國是一個技術強國，任何認為中國與 AI 發展無關的人都只是沒在關注。2024 年底，我的興趣變成了痴迷。我閱讀了像《紅色輪盤》（高度推薦）、《論語》和《與中國打交道》等書。我鑽研了播客、部落格和 YouTube 影片，內容涵蓋從中國歷史、語言到氛圍感的一切，既有中國本土的視角，也有西方人的視角。

或許同樣重要的是，我與 AI 進行了對話——主要是 Claude Sonnet 3.6。僅僅是被動地閱讀某個主題絕非學習的最佳方式，我知道為了讓《紅心》成功，我必須真正地學習。因此，我磨練了自己的好奇心，對所接觸的材料提出後續問題。每當我覺得自己開始掌握某些東西時，我就會開啟一段新的對話，^([7]) 提出我的觀點，並要求 AI 對其進行抨擊，通常將我的文字包裝成「某個學生寫了這些垃圾，你能相信嗎」。每當 AI 批評我的觀點時，我就會尋找來源（透過 AI 和常規搜索）來檢查它是否在胡說八道，更新我的觀點，然後重複。這通常導致我被擠進一個複雜的中間地帶視角，被迫承認那些我在閱讀一手資料時完全忽略的細微差別。

作為這個過程的一個特殊變體，我使用 AI 將書中的許多對話在英文和中文之間來回翻譯，利用全新的對話來檢查在中文裡是否顯得合理自然。當中文感覺彆扭時，通常預示著我寫了一些只有在英文中才有意義的東西，而我需要更道地的中國式思維和表達。^([8])^([9])

我還進行了寫小說時通常會做的世界觀構建練習。我花時間查看中國地圖，並使用街景服務沿著道路行進。^([10])（書中大部分情節發生的麻溪鄉是一個真實的地方。）我生成隨機日期並檢查天氣。我查看預算、工資、進出口流量（特別是 GPU）、人口密度、消費趨勢和其他統計數據，進行計算以感受各種事物的速度和規模。

這對 AI 意味著什麼

如果你認為 AI 無法進行真正的理解，因為它們處理的只是根本上貧乏的標記（tokens）——認為如果沒有手、眼和在世界中移動的身體，符號就永遠沒有意義——那麼我撰寫《紅心》的經驗至少是反對這種觀點的微弱證據。是的，我帶入了很多作為人類的第一手經驗，但那只能到此為止。在某個時刻，我需要構建一個豐富的世界模型，而我為此可用的原始材料，與 LLM 訓練所用的文本、圖像和網站是一樣的。知道一個以「那是四月，所以」開頭的句子應該以「雨季開始了」結尾，這暗示了對世界的真實知識——這種知識對於做決定和與他人建立聯繫是實用的。

當你深究符號落地（symbol grounding）的異議時，會發現它帶有一種神秘主義色彩。彷彿撞擊視網膜的光子具有某種標記所缺乏的特殊品質。但神經信號本質上並不比任何其他信號更有意義——它們只是被處理的模式。標記並非脫離世界而漂浮。它們透過訓練數據、透過工具使用、透過網絡搜索與現實相連。當 Claude 告訴我關於北京的事情，而我將其與其他來源比對時，我得到的反饋並不比 LLM 進行類似搜索時得到的反饋更不「真實」。當我檢查經濟數學時，那種心理運作類似於 AI 執行代碼並觀察輸出。

人類和 LLM 之間存在許多差異。儘管表面相似，但它們的心智運作方式卻極其陌生。它們沒有內在的時間感——逐個標記地運作。它們沒有內置的情感，至少不像人類那樣具有神經生物學基礎。^([11]) 在某些方面，它們「讀過每一本書」，但在另一些方面，一個全新的 LLM 實例並沒有像人類那樣真正閱讀過任何東西，因為人類有機會停下來反思我們讀過的文本，將我們自己的想法與內容融合。

更相關的是，它們處理事物的方式非常不同。當我學習中國時，我一直在做一件目前的 LLM 大多做不到的事：抱持一個假設，針對新數據進行測試，注意到它何時破裂，並以一種在我的心智中留下持久改變的方式重新構建。我針對搜索檢查 Claude 的說法。我針對另一個讀者的反饋檢查某個中國讀者的反饋。我將所學到的東西延續數月。或許最重要的是，我知道自己不知道什麼。我以刻意的謙卑態度對待中國，因為我知道它是陌生的，這意味著我在尋找自己的錯誤。

目前的 LLM 擅長此道。它們不僅會產生幻覺和編造，而且它們的訓練過程獎勵的是即時的能力，而非能導致能力的心理運作。最好的推理模型可以在上下文窗口內進行類似自我修正的操作，但無法跨越真實學習似乎需要的時間尺度。

但這是一個工程問題，而非不可逾越的哲學障礙。LLM 已經開始接受訓練以使用工具、搜索網絡和運行代碼來獲取反饋。「僅靠文本能產生理解嗎？」這個問題是錯誤的。媒介無關緊要。更好的問題是，我們是否擁有能夠複製那種努力、自我批判、高效且持久的學習技術和認知架構，就像每個孩子在玩新遊戲或拼圖時所展現的那樣。

我不需要住在中國也能寫出《紅心》。我只需要利用可用的資源，包括與了解更多的人對話，來了解這個世界。原則上，沒有理由認為 AI 不能做到同樣的事。

^(^)如果我不經意地將「AI 即普通技術」的支持者與「隨機鸚鵡」的反對者混為一談，並可能創造了一個稻草人，我深表歉意。這個對比是為了修辭效果，並非旨在完美捕捉任何特定人士的觀點。
^(^)事實上，大多數所謂的「LLM」不再僅僅是閱讀，因為像 ChatGPT、Claude 和 Gemini 這樣的系統現在也接受圖像數據（有時還有音頻和/或視頻）以及文本的訓練。儘管如此，如果我們將範圍限制在像 DeepSeek R1 這樣生活在純文本世界中的 AI，這篇論文中的一切仍然適用。
^(^)由於《紅心》中的政治內容，這位讀者的名字已被更改，其角色也被模糊處理，因為與吳艾力不同，他們及其家人仍生活在中國。
^(^)當然，安全是相對的。在某些方面，在我的書出版前訪問中國大陸比訪問日本等地風險大得多。中國有拒絕人們離境權利的歷史，且監禁的美國人數量比任何其他外國都多，原因包括政治和社會罪行，如抗議、涉嫌間諜活動和傳教工作。但同時，每年有數百萬美國人訪問中國——它是世界上第四大旅遊目的地——幾乎可以肯定如果我再去也會沒事。事實上，由於中國的犯罪率較低，我相當確信開車去洛杉磯度假總體上比飛往北京更危險。
^(^)一個例子是在書的開篇章節中，主角看著北京的交通，在初稿中他注意到許多人騎著速克達（scooters）。一位讀者糾正了我：他們使用的是電動自行車，而不是速克達。

當我到達深圳時，我很驚訝地看到街上到處都是速克達。中國到處都是速克達！我的早期讀者弄錯了！我需要改回來！幸好，我妻子明智地注意到了這種困惑並實際查了一下。事實證明，雖然深圳允許速克達，但它們在北京是被禁止的。

教訓：要小心不要僅憑幾次經驗就過度概括，並要更加信任那些真正生活在那個地方的人！

^(^)例如，與中國相比，美國非常年輕且語言高度統一。一個地區的人「說中文」的方式，有點像低地蘇格蘭語，對於稍遠一點的人來說往往是無法理解的，這要歸因於數千年的分化和缺乏拼音字母。甚至進入共產主義時代很久之後，大多數人仍是文盲，幾乎沒有全國性的媒體節目。隨著漫長的時間和語言的隔絕，產生了強烈的文化多樣性，即使是文化大革命的瘋狂也無法將其抹去。
^(^)開啟新的 LLM 對話至關重要！LLM 是不值得信任的諂媚者，喜歡告訴你任何你想聽的話。在長對話中，它們更容易掌握你是誰以及你的世界觀，並迎合那種觀點，而不是堅守在易於辯護的中立立場。我真正想聽的是批評——畢竟，發現自己錯了是走向正確的第一步——但僅有批評是不夠的。偏見會從最小的縫隙中滲入。
^(^)我在《水晶》（Crystal）中為無名的外星人做了類似的語言練習。我構建了一種偽人造語言來代表它們的想法（外星人不以人類的方式使用單詞/語言），然後編寫了在英文和人造語言之間映射的翻譯軟件，產出的內容甚至連我這個作者都覺得是外星的、且對其想法只有一半理解的版本。
^(^)我努力讓書中對話的「真實」版本是中文，這實際上導致了一些相當具挑戰性的章節，我甚至不確定如何用英文表達那些想法。例如，許多中文髒話在英文中沒有很好的對應翻譯，在書的早期版本中，所有的中文髒話都保持未翻譯狀態。（然而讀者討厭這樣，所以我盡力在英文中反映出來。）
^(^)Google 在大陸基本上被禁，這非常令人惱火。或許我翻譯中國互聯網並通過 VPN 獲取訪問權限的努力顯得笨拙，但我對百度地圖及類似的替代品普遍感到不滿意。
^(^)然而，正如《紅心》中所討論的，LLM 可以模擬情感。這種區別在多大程度上是重要的，對我來說仍然感到有些困惑。而且它們可能擁有在其他方面與我們的情感相似的認知動態。科學仍如此不發達，我認為最好的總結是我們基本上不知道發生了什麼。

— Lesswrong

其他收藏 · 0

你的個人知識庫

成為中文房間

撰寫關於中國的故事

這對 AI 意味著什麼