你無法掌控奧佛頓之窗：政治並非室內設計

Lesswrong·大約 4 小時前

AI 生成摘要

文章指出，試圖透過移動奧佛頓之窗來策略性地操縱公眾輿論通常適得其反，且源於對複雜適應系統的錯誤理解。文章以人工智慧安全運動的訊息傳遞為案例，展示了策略性的語氣保留如何導致失去清晰度與真實性，卻未能真正控制公眾的認知。

有時，人們不說出真實想法，並非因為說出來會顯得無禮或代價高昂，而是因為他們相信現在說出來會適得其反。他們察覺到真實的主張超出了「奧本視窗」（Overton window，大眾可接受的言論範圍）。因此，他們得出結論：策略性的做法是說一些較溫和、鄰近的主張。這讓你能在不觸發免疫反應的情況下使框架正常化。你現在稍微重新設計一下房子，以便日後滑動那扇窗戶。然後，你想像著，當地面發生位移時，真實的主張就會變得可以說出口。

策略性話語博弈？

以上是對高維度話語博弈（discourse chess）的一種嘗試。在政治和思想界，人們似乎一直在玩這種遊戲。但基於 Rob Bensinger 最近的一條評論，我想論證：這種博弈背後的自負——即我們能模擬大眾接受度如何轉變，並巧妙地干預以引導這些轉變——通常是錯誤的。這並非指話語沒有結構，也不是說框架毫無意義。

大多數人極大地高估了自己預測任何事物（包括策略性言論）二階和三階效應的能力。而這是一個比你預期更具破壞性的錯誤。奧本視窗作為一種粗略的描述確實存在，但你無法獨自重新設計遊戲盤面。如果你試圖利用這扇窗戶來導航，它就會變得完全不透明。

儘管如此，人們慣常地以策略性定位取代直白陳述，擬像（simulacra）層級向上攀升，論點的提出是為了想像中的下游效應，而非基於其本身的價值。運動扭曲了自己的公開立場，隨後便遺忘了這種扭曲。修飾後的版本變成了新人學習的內容，而原始的評估僅存在於私下交談中。在與他人交談時，他們需要「剝開一層又一層的廢話先驗，才能開始重建正確的基礎假設，而任何你想討論的事情都必須建立在這些假設之上」。

是的，奧本視窗確實存在，但是……

任何社會都有言論自由區、代價高昂區和近乎不可言說區，而這些區域是會移動的。重複會改變顯著性。機構會賦予或撤回合法性。危機使先前邊緣的想法突然變得具體。這些都沒有爭議，也不是我反對的觀點。

錯誤始於將一個粗略的描述性隱喻提升為因果模型，而該因果模型許可了對簡單溝通的偏離。「移動窗戶」在有數十個窗戶被不同人使用、且你不知道其中哪些可以被誰移動時，是行不通的。

說話語邊界會移動是一個真實的聲明，這有助於你自己和他人理解成本並做出決定。但從那裡跨越到說你或某個特定的人可以可靠地預測他們的言論行為將如何移動這些邊界（透過中間人鏈條、聯盟反應、媒體扭曲和反向動員），則是一個完全不同的主張。前者是重要的社會觀察；後者是對複雜適應系統的預測，應當遵循我們通常應用於此類預測的標準。即使我們對撒謊（或許是隱瞞，或許是粉飾太平，做出比我們相信的更弱的陳述）沒有道德顧慮，如果關於操縱他人的能力的預測是錯誤的，我們仍不應這樣做。

……它們能被可靠地操縱嗎？

因此，我們可以撇開道德爭論（儘管人們希望這已足夠），轉而詢問：預測中操縱社會現實的能力是否正確？考慮一下執行一個成功的高階話語策略究竟需要知道什麼。不僅是「當我說 X 時會發生什麼」，還有「因為他人對我說 X 做出反應，以及因為還有其他人對那些反應做出反應，且因為機構根據這種模式進行更新，會發生什麼」。

你需要知道哪些受眾重要，哪些中間人會放大或重塑你的陳述，反對聯盟將如何解讀這一舉動——不僅是他們對該主張的看法，還有他們對你、你的聯盟以及爭端軌跡的推論。你需要知道你引入的框架會保留在你手中，還是會被對手奪取並重新利用。我們很容易認為自己腦中的圖景就是那扇窗戶，但當你無法看穿腦中的版本時，就很難知道真相。在實踐中，似乎沒有人能以自信策略所需的分辨率了解這些事情——儘管正如馬格利特（Magritte）略微提到的那樣，這就是人類的處境。

更糟糕的是，言論行為與其下游效應之間的因果路徑部分是隱藏的，部分是不穩定的，且部分是由那些同樣試圖操縱該系統的人的行為所塑造的。畫作實際上改變了它背後的風景。反饋迴路穿過媒體、機構和聯盟動態，這些因素單獨來看都很難建模，集體來看則超出了「我將在三年內逐步移動窗戶」所要求的精確度。市場存在，價格波動是真實的，但大多數人無法從宏觀敘事中獲利交易。奧本視窗也是同樣的東西——它指向真實的事物，卻沒有給你一個儀表板。

為什麼你會認為這行得通？

過度自信很大程度上源於敘事可得性（narrative availability），也就是說，事後選擇偏差。話語轉向在事後很容易解釋，即使在事前很難預測。一旦同性婚姻獲得多數支持，或者一旦伊拉克戰爭變得普遍不受歡迎，你就可以講述一個清晰的回溯故事，說明可接受度是如何移動的：框架在這裡轉移；關鍵事件在那裡發生；轉折點是這個。但對於每一個聽起來引人入勝的回溯敘事，都有數十條替代路徑在事前聽起來同樣合理，卻未能實現。沒有人會為那些消失得無影無蹤的策略性框架寫檢討報告。

聰明且熱衷政治的人在這裡特別脆弱。他們沉浸在話語中，不斷追蹤象徵性的舉動，並在自己的圈子裡看到許多局部反應，誤以為那是系統層級的可見性。一位政策知識分子看著自己的文章在華盛頓的某個角落流傳，便得出結論認為自己了解大眾輿論的運作機制。但在狹窄的專業圈子內可見的反應，對於更廣泛、更混亂、更不留心的公眾將如何反應，是一個極具誤導性的樣本。

AI 安全的案例

回到引發這篇長文的對話，有效利他主義（EA）運動圍繞 AI 風險訊息傳遞的長期策略考量就是一個典型的例子。多年來，社群中的許多人相信先進 AI 構成了嚴重且/或生存風險，但擔心直白地說出來會顯得危言聳聽，並使該關注點超出體面政策討論的窗戶。公眾詞彙被仔細調節：強調近期傷害，使用「對齊」（alignment）等技術術語，在提出更強烈的主張前先與機器學習（ML）權威建立公信力，避免「引人發笑」的因素。這種策略邏輯在社群內部被明確且不斷地討論。

正如 Rob Bensinger 最近所說（這直接啟發了我的分析）：「EA 試圖在奧本視窗上玩十一維棋局，其效果可能比科學家、普通大眾和政策制定者對任何聽起來稍微可怕、令人擔憂或詭異的技術的正常反應還要糟糕。」我同意這一點，但也想指出，Rob 的陳述也是我所譴責的那種話語事後追溯。

為了說明這一點，我先試著把故事講清楚。由 Yudkowsky 領導的 Lesswrong 理性主義者開始思考並擔憂 AI 風險。關於技術擔憂和預期風險為生存等級的理由，數位文章堆積如山。Bostrom 接過了火炬，而他當時與 MacAskill 和 CEA 就在同一個辦公室。但理性主義團體試圖小心地注意到骷髏頭，而正如 Rob 所說，EA 們在政治上更精明，不想太大聲談論狂熱主義；這在學術論文中被較安靜地承認，但大多數運動參與者試圖淡化任何關於滅絕的直接主張，轉而更多地談論「全球性災難」（Global Catastrophes），儘管其本意是指生存風險。（我肯定也犯了這個錯，例如將全球性災難與滅絕混為一談。）

然而，當 EA 們過於聰明地避免說出「如果有人製造出 ASI（人工超智能），每個人都會死」時，公眾幾乎在一夜之間對 AI 產生了強烈興趣。EA 社群之外的知名人士開始談論滅絕風險，而完全沒有經過那些所謂必要的精心鋪墊。話語的移動是因為外生的技術衝擊，而非因為框架策略。當公眾關注的時刻到來時，該社群的公開定位顯然比其私人信念更具保留且不夠清晰。多年的策略性耐心並未移動窗戶；它們移動了運動自身的聲音，使其偏離了成員的真實想法，導致他們在突然需要提出直接論證時準備不足。

我不想在兩方面誇大這一點。首先，那些年建立的大部分公信力似乎是有幫助的。甚至可能有些案例中，關於該說什麼的耐心框架工作奠定了基礎，並以我無法追蹤的方式產生了回報。但 Rob 所概述的大致輪廓——即多年的策略性保留、一個按其自身邏輯移動辯論的外生衝擊、一個因自身謹慎而措手不及的社群——是具有啟發性的，即使那段時間內的任何個人判斷在當時看來都是合理的。

但其次，這誇大了 EA 社群對 AI 生存威脅存在的信心。事實上，最擔憂和最不擔憂的人之間過去和現在都存在非常明確的分歧。不出所料，這些分歧在對外和對內都不清晰。EA 的優先事項據稱存在共識，即使不應該有，因為實際的道德觀點各異。但正如我在那裡所說，「原因優先級排序是集體性的，因此是崩潰的」——且[正如我後來所說](Cause Prioritization is Communal, and Therefore Broken)，該社群是難以解讀且混亂的——他們需要澄清觀點並反擊虛假的共識。

反擊也是一種操縱

因此，虛假共識效應是一個真正的危險，我認為這反過來傷害了社群。但當 Scott Alexander 說「嘿，我部分不同意這種溝通方式，我想給予其他人社交許可也來表達不同意見」時，這在某種程度上是在以我認為需要的方式反擊共識敘事，但這也是在明確推動擴大奧本視窗的二階效應。

顯而易見，我認為這既是好事也是壞事。正確的一點是真理並不總是獲勝，且溝通是困難的（參見：維奧定律 Wiio's laws）。Scott 說我們需要指出分歧時是完全正確的。但在一個關於該說什麼、不該說什麼以對他人會說什麼、不會說什麼產生某種可預測影響的元對話討論中，任何給定的觀點通常甚至連錯誤都談不上。Scott 說他不同意的部分看起來很好，但他為了改變話語而這樣做的部分看起來很糟。（但他承認自己錯了：「我有個愚蠢的性格缺陷，我相信只要我解釋得夠清楚，每個人都會同意我是公平的，一切都是誤會。我同意這很愚蠢……」）

即使是言論的一階效應也很難預測。你說了一件事；不同的受眾聽到不同的內容；媒體生態系統進行篩選和扭曲；對手選擇任何對他們有利的解讀。即使在這個層面上，自信的預測也經常出錯。

二階效應則因組合因素而更糟。現在你預測的不僅是直接反應，還有對反應的反應：盟友更新對你的模型，敵人動員，中立者推斷聯盟身份，機構重新分類你是哪種行為者，投機者劫持任何看似新出現的框架。每一種反應都反饋到其他反應中，且每個行為者本身都在制定策略，這意味著系統是自反的（reflexive）——你試圖操縱它的嘗試改變了它。

當有人超越了 Scott 的做法，達到三階版本——「我實際上並不認可這個主張，但現在表達它會讓相關主張在兩年後更容易推進，因為話語將以以下方式轉移」——他們是在撰寫投機性的政治話語小說。干預變量太多，環境對外部衝擊過於敏感，這種規劃不配被稱為「策略」。

同樣，這種錯誤是可以理解的。因為選擇效應強化了它能奏效的想法。極少數多步話語策略似乎奏效的案例成了著名的教學範例，人們在辯護這種做法時會引用這些例子。當然，更常見的失敗案例從未被貼上策略失敗的標籤。它們消失在無疾而終的大量政治言論中。人們從精華片段中學習，並得出結論認為這場遊戲是可以贏的。你想要例子嗎？看看數十年的動物權利倡導，他們試圖玩將吃肉推向奧本視窗之外的遊戲，使用的策略從潑漆、廣告牌到暴力不等。

但還有另一個錯誤發生，因為對於策略性過度自信的普遍存在，還有一個更簡單且不那麼體面的解釋。將自己視為輿論動態的微妙導航者是令人愉悅的，而承認自己大多是在猜測則沒那麼令人愉悅。「這會適得其反」通常是避免說出代價高昂之言的最具聲望的方式。我不認為每一個策略性沉默的例子都是合理化的懦弱。但系統的不透明性使得我們很難分辨何時是、何時不是，而這樣做的人最不適合做出判斷。

另一個現實世界的例子：削減警察經費（Defund the Police）

當策略邏輯在真實的對抗環境中受到測試時，會是什麼樣子？

2020 年的「削減警察經費」是一次明確、自覺的奧本視窗策略實踐。在喬治·佛洛伊德被謀殺後，活動人士根據一個特定理論採用了這個口號：透過佔據極端主義立場，你移動了窗戶，使得更溫和的改革——將部分警察資金重新分配給社會服務、平民監督、社區投資——相比之下顯得像是中間派。這是教科書式的窗戶拉伸。邏輯在抽象層面上聽起來很清晰。

實際發生的情況是，對手而非盟友決定了這個口號在公眾面前的含義。共和黨策略師將「削減警察經費」貼在每一張選票上的每一位民主黨人身上。溫和派民主黨人在接下來的兩年裡試圖與大多數人從未持有過的立場保持距離。那些本應顯得合理的改革，反而因與極端框架的關聯而遭到抹黑。民調一致顯示，這個口號甚至在強烈支持潛在政策目標的黑人選民中也不受歡迎。框架變成了它本應促成的改革的障礙。

這種模式值得分離出來，因為它反覆出現。在對抗性環境中，你無法引入一個框架後又控制它如何傳播。你的對手會選擇服務於他們的解讀，媒體會放大產生參與度的版本，而聯盟動態會將含義拉離你的意圖。框架會變得野性難馴。你也可以在較小的事件中看到這一點，原本旨在支持某種觀點的框架手段被奪取並重新利用，而謹慎的正常化嘗試反而觸發了先發制人的反對。策略師的錯誤通常僅僅在於他們將話語建模為彷彿他們的舉動是最後一著，而現實中每個其他行為者也都在玩這場遊戲。

另一種常見的失敗則更安靜。策略性沉默凝結成自我審查。人們告訴自己他們在等待更好的時機，而更好的時機永遠不會到來，因為這種計算是不可證偽的。永遠可以說時機尚未成熟。私人觀點與公開陳述之間的差距擴大，沒有人能確切解釋誠實版本原本該在何時出現。對於半個圈內人來說，這就是 EA 社群多年來 AI 訊息傳遞的樣子。這在其他運動中也非常普遍，應被視為預設結果而非令人驚訝的結果。

策略性話語博弈的表現通常不如直接說出真相。

那麼，你究竟該怎麼做^([1])？

直接的論證——即說出你的想法並解釋原因——具有策略性間接所缺乏的屬性：他人可以參與其中。證據可以對其產生影響。分歧會清晰地浮現，而不是作為對每個人「真正」相信什麼的相互猜疑而潰爛。你不是在依賴你的言論行為與未來公眾輿論狀態之間隱藏的因果鏈。你是在提出一個主張並觀察它是否成立。

這並不總是會得到回報。誠實的言論沒有能使其具有說服力的神奇屬性，許多正確的事情被清晰地說出後卻被忽視了數十年。我確實不確定這種規範能延伸到什麼程度——在立法談判、外交、或擁有專業策略師和緊密反饋迴路的實際政治競選中，計算方式可能不同。但在大多數人實際面臨這種選擇的語境中——寫作、公開辯論、運動內部討論、知識生活——直接性具有實際優勢：你會得到有用的反饋。你會發現哪些反對意見反覆出現，你的觀點哪些部分是錯誤的，誰是真正同意，而誰只是出於聯盟忠誠而點頭。如果你從不說出你的本意，你就永遠無法得知它是否正確。

而且重要的是，誠實並不意味著刻薄！正如 Scott Alexander 所建議的，保持友善，至少直到你能協調刻薄為止。我會強調「至少」。通常最好就是保持友善^([2])並說出真相。這在複雜環境中更為關鍵，在這種環境中，圍繞混淆性聯盟建立的聯盟，當委婉語被解碼時（它們最終總是會被解碼）就會破裂。圍繞對真實主張的既定分歧而建立的聯盟，至少知道他們在同意什麼和反對什麼。如果你想與版權絕對主義者、藝術家公會和計程車工會合作監管 AI 的使用和誤用，你們都應該知道彼此有不同的動機，這樣你就不需要對你的盟友或對手撒謊，或是玩弄過於聰明的策略。

顯而易見的結論

奧本視窗存在。可接受度會轉移。框架很重要。這些都不能賦予你進一步的主張，即你對遊戲運作機制的理解足以讓你進行遠程博弈。這當然也不能許可你因他人的說話方式而譴責他們。

我的總結建議並不需要多頁的故事和分析。如果你認為某件事是真的，通常就說出來。如果你認為它是假的，通常就不要說。如果你偏離這一點的主要原因是關於公眾輿論動態在未來幾年將如何展開的複雜理論，那麼你和他人應該比通常情況下更懷疑你自己^([3])。

但請注意，系統的不透明性如何使人輕易地將恐懼合理化為謹慎。當策略形勢確實無法解讀時，任何程度的謹慎都可以被包裝成老練的克制，而且你永遠無法被證明是錯的，因為你從未進行過反事實驗證。

大多數出於策略原因拒絕說出想法的人並非在執行計劃。他們是在給自己講一個關於計劃的故事。這是一個看起來不錯的計劃，因為它是不可證偽的；相關的因果結構是無法解讀的。它也是自利的，因為它將風險規避重新品牌化為老練。

再次強調，試圖透過所謂的策略性社會效應來洗白薄弱的真理主張，通常比陳述對象層級的觀點更糟。事實上，你並不知道話語遊戲最終如何兌現。那種精心建構的自信是毫無根據的。奧本視窗真實到足以約束你，但還不夠清晰到能像下棋一樣玩弄。如果你看不見轉角處的情況，就停止假裝你的沉默是政治手腕，不要撒謊，直接告訴人們你不想談論這件事。

註：在構思大綱並起草部分內容後，本篇文章由大型語言模型（LLM）充實內容（根據章節不同，風格模仿 Rob Bensinger 或 Oliver Habrycka），隨後經過仔細審核與大量編輯。圖像由 LLM 建議或生成。

^(^)除了在開始閱讀章節前先看標題，這樣你就知道它們會說什麼。
^(^)這應該是顯而易見的，但清晰地說出真相並不等同於用最具侵略性的方式說出來，以證明你不在乎社交後果。那要麼是它自己的一種策略性姿態，受同樣的批評約束，要麼就是個混蛋，這不是藉口。這裡的規範應該是誠實，而非挑釁。
^(^)話雖如此，策略性排序有時確實有效。漸進主義有真實的成功案例。法律運動會刻意安排論點的先後順序。某些主張確實需要先決條件才能落地——共同的詞彙、機構信任、使主張可解析的背景概念。

這一切都無法挽救針對公眾對話的更複雜的一般策略。策略性溝通成功的案例往往具有特定特徵：明確定義的受眾、短因果鏈、機構支持，以及能讓你修正航向的緊密反饋迴路。在瀰漫、對抗、多受眾的媒體環境中進行自由話語策略，幾乎不具備這些特徵。成功案例恰恰是那些與常態情況最不相似的案例。

參與討論

— Lesswrong

其他收藏 · 0

收藏夾