如何令人信服地談論AI帶來的生存威脅

Lesswrong·6 個月前

這篇文章概述了如何透過真正理解對象、保持徹底誠實以及深入掌握核心技術論點，來有效地討論人工智慧的生存風險。藉由觀察他人的立場並避免不誠實的修辭，我能更好地縮小他人現有世界觀與 AI 危險現實之間的差距。

我認為自己在私人對話中相當擅長說服人們關注 AI 的危險性。這篇文章將探討與人溝通 AI 危險性並達成說服效果的基本要領。

前提條件

I. 學會真正「看見」他們

2022 年，在一次 CFAR（應用理性中心）的工作坊中，我接觸到了「環繞練習」（Circling）。

這是一種多人冥想。人們圍成一圈交談，但對話內容主要集中在「元層面」（meta）：某人的言論或表達在你心中引起了什麼感受、你如何與他人建立連結，以及當下整個群體的狀態。

這有時是極佳的體驗；但更重要的是，它能讓你 (1) 注意到他人內在發生的變化以及你對他們的認知模型，並且 (2) 將你的假設顯性化，詢問對方實際情況，進而驚訝地發現自己對他人的判斷往往大錯特錯！這非常棒，能讓你迅速更新認知，學會敏銳地觀察他人，並以一種更接近真實的方式「看見」他們。

（相關閱讀：Circling as Cousin to Rationality）

我認為與人溝通 AI 危險性的第一步就是學會嘗試看見他們：留意他們的立場、他們的世界觀模型、他們的經驗感受，以及是什麼產生了他們的疑問和論點。

（如果你帶著觀察他人內在、觀察人際互動以及當下狀態的意圖參與環繞練習，並將直覺轉化為預測，從錯誤中學習，這將是提升這項能力的絕佳方式。）

這會讓你更直觀地判斷該提出什麼論點，才能引導對方從現有的認知出發，進而看清世界的現狀。

II. 保持誠實

不要使用企業公關辭令，也不要閃爍其詞。永遠誠實地表達你為什麼相信這些危險。如果你是因為不了解機器學習（ML）而選擇信任專家，且認為當 Geoffrey Hinton 對其畢生事業感到後悔、並認為全人類滅絕機率大於 50% 時，世界仍在競逐超智慧是一件瘋狂的事，那就直說，不要迴避。

使用有效的論點。使用真實的事實。如果你對某事不確定，就誠實地表達你的不確定。

目標是讓每個人都更接近世界的真實狀態。不誠實不僅在現實生活中會產生反效果，其效果也不如真相。真相擁有細節和根基，真實的論點聽起來力量感是不同的。

當你非常、非常想衝動地脫口而出某個看似完美的完美回擊時，停下來問問自己：這真的是事實且邏輯有效嗎？

學會察覺自己何時並非完全相信所說的話，並及時退回或修正。每當你成功做到這一點時都要感到高興，並確保收回任何你意識到未能精準呈現現實的言論。

最後，誠實與真相是我們的優勢。在一場比拼誰能提出最具說服力的「不誠實/誤導性/有瑕疵」論點的競賽中，另一方會贏，因為他們有更多資源投入到製造這些具說服力的瑕疵論點中。當雙方都能提出論點時，我們這方能贏，唯一的原因就是真相站在我們這邊，而我們可以指明它。

所以：保持誠實。

（另見：A case for courage, when speaking of AI danger）

III. 努力深入理解主題

你需要透徹理解（grok）論點背後的深層生成邏輯，而不僅僅是論點本身：這樣你才能以既能契合對方認知、又能保持有效、具說服力且與現實掛鉤的方式來回答問題和反駁。

閱讀 Arbital 上關於 AI 對齊的文章、Yudkowsky 和 Soares 在 2022 年發布的文章、他們 2023 年的部分文章（例如：Deep Deceptiveness）、If Anyone Builds It 及其補充材料。

看看你是否能理解更深層的教訓。你是否能感覺到「急劇轉向」（Sharp Left Turn）問題的核心在於……

……自然屬性的增長，而非脆弱/隨機屬性的增長？

觀察目前的流行觀點：WaitButWhy、Oprah 和 Snoop Dogg 對超智慧 AI 的威脅怎麼說？

這點非常選配，但如果能做到會很有用：嘗試培養一點「安全思維」（security mindset）。去嘗試一些簡單的 CTF（奪旗賽），或學習 SQL 注入和 XSS 攻擊背後的原理，讓你能夠舉一反三，察覺系統在惡意優化下會在哪裡崩潰。

你能說明如果超智慧成功地優化「最大化人類主觀幸福感」會發生什麼嗎？

你能說明為什麼我們甚至連這點都做不到嗎？

尋找對齊超智慧的提案。你能看出它們為何會失敗，或者為何沒有解決問題中最核心的難點嗎？

溝通三步驟

（適用於一對一情境）

1. 識別他們可能缺失的信息

假設與你交談的人很聰明，而他們之所以不認為 AI 在預設軌跡下可能殺死所有人，是因為他們不了解現實世界的某些事實（或者因為尚未遇到能引導他們得出該結論的思維鏈，因而尚未做出推論）。目標是持續找出並更新「他們所知」與「現實世界」之間的落差（diff），並思考說什麼能最快引導他們跨越鴻溝，從現有的心智狀態轉向理解關鍵事實。

（要讓一個想法從「被考慮」提升到「被嚴肅對待」，需要比單純給予權重更多的信息量。這些信息是什麼？什麼能激發他們的好奇心？

如果他們缺失的主要信息是「許多科學家和專家表示 AI 確實可能殺死所有人，這是一個非常令人擔憂的威脅」，這也是有效的切入點，但要確保他們對「為什麼」感到好奇，而你也要知道他們在「為什麼這是真實威脅」的認知上缺失了什麼。

有時，如果你穿著得體（雖然不要為此出賣靈魂；我也曾穿得很宅地讓外交官對現狀感到恐懼）或擁有顯而易見的可信度/可靠性，同時表現出對 AI 滅絕危機的極度擔憂，這會很有幫助。出人意料會帶來大量的信息量，激發人們的好奇心，有時也讓他們更容易信任你的話。）

2. 專注傾聽

持續嘗試看見對方。你的焦點在於他們。重要的是他們的狀態、好奇心、背景和本能反應。為了提供對他們而言最直觀易懂、且能高效讓其認知貼近現實的解釋，你需要持續運用「系統一」（直覺思維）去關注這些細節。

留意自己是否在重複。發現自己在重複某些話通常沒關係：也許你第一次沒說完是因為發現他們缺乏某個前提知識，而現在他們準備好聽了；或者他們第一次漏掉了，現在過了一陣子想回頭聽清楚。然而，有時這意味著溝通出了大問題；你不應該陷入死循環。如果看起來像是在繞圈子，請停下來；你可能已經偏離了幫助他們理解現狀的目標！仔細聽他們說話，弄清楚你現在說的話是否有幫助（以及為什麼）。以他們需要理解什麼、對什麼感興趣為導向。只在當下溝通他們主動想學習的內容。 思考你是否誤判了他們，或是選錯了詞；嘗試重置對話，轉向另一個獨立的分支，或者尋找並處理他們認知模型中更深層的原因或部分。

3. 表達觀點

目標是幫助他們學習那些他們缺失且想學習的信息。所以：根據他們的價值觀說出對他們有幫助的話，而不是說你想說的話。

（這不代表你不能展現真實的自我！如果某件事讓你興奮或恐懼，你可以離題分享。但重點要放在對他們重要的事情上；如果他們問你某件事，就回答他們實際問的問題，而不是回答另一個你認為值得討論的相關問題。重要的是「基於他們的背景，他們相信某事的理由」，而不是「基於你的背景，你相信某事的理由」。）

練習以上所有內容

好奇的 Uber 司機？你的大學教授？朋友或家人？

你會與許多人互動，無論親疏。

與他們交談。保持專注。觀察什麼有效；觀察你說什麼時能激發好奇心。

磨練你的技能。實驗與探索。去說服。

祝你好運！

— Lesswrong