如何令人信服地談論AI帶來的生存威脅
這篇文章概述了如何透過真正理解對象、保持徹底誠實以及深入掌握核心技術論點,來有效地討論人工智慧的生存風險。藉由觀察他人的立場並避免不誠實的修辭,我能更好地縮小他人現有世界觀與 AI 危險現實之間的差距。
我認為自己在私人對話中相當擅長說服人們關注 AI 的危險性。這篇文章將探討與人溝通 AI 危險性並達成說服效果的基本要領。
前提條件
I. 學會真正「看見」他們
2022 年,在一次 CFAR(應用理性中心)的工作坊中,我接觸到了「環繞練習」(Circling)。
這是一種多人冥想。人們圍成一圈交談,但對話內容主要集中在「元層面」(meta):某人的言論或表達在你心中引起了什麼感受、你如何與他人建立連結,以及當下整個群體的狀態。
這有時是極佳的體驗;但更重要的是,它能讓你 (1) 注意到他人內在發生的變化以及你對他們的認知模型,並且 (2) 將你的假設顯性化,詢問對方實際情況,進而驚訝地發現自己對他人的判斷往往大錯特錯!這非常棒,能讓你迅速更新認知,學會敏銳地觀察他人,並以一種更接近真實的方式「看見」他們。
(相關閱讀:Circling as Cousin to Rationality)
我認為與人溝通 AI 危險性的第一步就是學會嘗試看見他們:留意他們的立場、他們的世界觀模型、他們的經驗感受,以及是什麼產生了他們的疑問和論點。
(如果你帶著觀察他人內在、觀察人際互動以及當下狀態的意圖參與環繞練習,並將直覺轉化為預測,從錯誤中學習,這將是提升這項能力的絕佳方式。)
這會讓你更直觀地判斷該提出什麼論點,才能引導對方從現有的認知出發,進而看清世界的現狀。
II. 保持誠實
不要使用企業公關辭令,也不要閃爍其詞。永遠誠實地表達你為什麼相信這些危險。如果你是因為不了解機器學習(ML)而選擇信任專家,且認為當 Geoffrey Hinton 對其畢生事業感到後悔、並認為全人類滅絕機率大於 50% 時,世界仍在競逐超智慧是一件瘋狂的事,那就直說,不要迴避。
使用有效的論點。使用真實的事實。如果你對某事不確定,就誠實地表達你的不確定。
目標是讓每個人都更接近世界的真實狀態。不誠實不僅在現實生活中會產生反效果,其效果也不如真相。真相擁有細節和根基,真實的論點聽起來力量感是不同的。
當你非常、非常想衝動地脫口而出某個看似完美的完美回擊時,停下來問問自己:這真的是事實且邏輯有效嗎?
學會察覺自己何時並非完全相信所說的話,並及時退回或修正。每當你成功做到這一點時都要感到高興,並確保收回任何你意識到未能精準呈現現實的言論。
最後,誠實與真相是我們的優勢。在一場比拼誰能提出最具說服力的「不誠實/誤導性/有瑕疵」論點的競賽中,另一方會贏,因為他們有更多資源投入到製造這些具說服力的瑕疵論點中。當雙方都能提出論點時,我們這方能贏,唯一的原因就是真相站在我們這邊,而我們可以指明它。
所以:保持誠實。
(另見:A case for courage, when speaking of AI danger)
III. 努力深入理解主題
你需要透徹理解(grok)論點背後的深層生成邏輯,而不僅僅是論點本身:這樣你才能以既能契合對方認知、又能保持有效、具說服力且與現實掛鉤的方式來回答問題和反駁。
閱讀 Arbital 上關於 AI 對齊的文章、Yudkowsky 和 Soares 在 2022 年發布的文章、他們 2023 年的部分文章(例如:Deep Deceptiveness)、If Anyone Builds It 及其補充材料。
看看你是否能理解更深層的教訓。你是否能感覺到「急劇轉向」(Sharp Left Turn)問題的核心在於……
觀察目前的流行觀點:WaitButWhy、Oprah 和 Snoop Dogg 對超智慧 AI 的威脅怎麼說?
這點非常選配,但如果能做到會很有用:嘗試培養一點「安全思維」(security mindset)。去嘗試一些簡單的 CTF(奪旗賽),或學習 SQL 注入和 XSS 攻擊背後的原理,讓你能夠舉一反三,察覺系統在惡意優化下會在哪裡崩潰。
你能說明如果超智慧成功地優化「最大化人類主觀幸福感」會發生什麼嗎?
你能說明為什麼我們甚至連這點都做不到嗎?
尋找對齊超智慧的提案。你能看出它們為何會失敗,或者為何沒有解決問題中最核心的難點嗎?
溝通三步驟
(適用於一對一情境)
1. 識別他們可能缺失的信息
假設與你交談的人很聰明,而他們之所以不認為 AI 在預設軌跡下可能殺死所有人,是因為他們不了解現實世界的某些事實(或者因為尚未遇到能引導他們得出該結論的思維鏈,因而尚未做出推論)。目標是持續找出並更新「他們所知」與「現實世界」之間的落差(diff),並思考說什麼能最快引導他們跨越鴻溝,從現有的心智狀態轉向理解關鍵事實。
(要讓一個想法從「被考慮」提升到「被嚴肅對待」,需要比單純給予權重更多的信息量。這些信息是什麼?什麼能激發他們的好奇心?
如果他們缺失的主要信息是「許多科學家和專家表示 AI 確實可能殺死所有人,這是一個非常令人擔憂的威脅」,這也是有效的切入點,但要確保他們對「為什麼」感到好奇,而你也要知道他們在「為什麼這是真實威脅」的認知上缺失了什麼。
有時,如果你穿著得體(雖然不要為此出賣靈魂;我也曾穿得很宅地讓外交官對現狀感到恐懼)或擁有顯而易見的可信度/可靠性,同時表現出對 AI 滅絕危機的極度擔憂,這會很有幫助。出人意料會帶來大量的信息量,激發人們的好奇心,有時也讓他們更容易信任你的話。)
2. 專注傾聽
持續嘗試看見對方。你的焦點在於他們。重要的是他們的狀態、好奇心、背景和本能反應。為了提供對他們而言最直觀易懂、且能高效讓其認知貼近現實的解釋,你需要持續運用「系統一」(直覺思維)去關注這些細節。
留意自己是否在重複。發現自己在重複某些話通常沒關係:也許你第一次沒說完是因為發現他們缺乏某個前提知識,而現在他們準備好聽了;或者他們第一次漏掉了,現在過了一陣子想回頭聽清楚。然而,有時這意味著溝通出了大問題;你不應該陷入死循環。如果看起來像是在繞圈子,請停下來;你可能已經偏離了幫助他們理解現狀的目標!仔細聽他們說話,弄清楚你現在說的話是否有幫助(以及為什麼)。以他們需要理解什麼、對什麼感興趣為導向。只在當下溝通他們主動想學習的內容。 思考你是否誤判了他們,或是選錯了詞;嘗試重置對話,轉向另一個獨立的分支,或者尋找並處理他們認知模型中更深層的原因或部分。
3. 表達觀點
目標是幫助他們學習那些他們缺失且想學習的信息。所以:根據他們的價值觀說出對他們有幫助的話,而不是說你想說的話。
(這不代表你不能展現真實的自我!如果某件事讓你興奮或恐懼,你可以離題分享。但重點要放在對他們重要的事情上;如果他們問你某件事,就回答他們實際問的問題,而不是回答另一個你認為值得討論的相關問題。重要的是「基於他們的背景,他們相信某事的理由」,而不是「基於你的背景,你相信某事的理由」。)
練習以上所有內容
好奇的 Uber 司機?你的大學教授?朋友或家人?
你會與許多人互動,無論親疏。
與他們交談。保持專注。觀察什麼有效;觀察你說什麼時能激發好奇心。
磨練你的技能。實驗與探索。去說服。
祝你好運!
相關文章