偏執:入門指南

Lesswrong·

我認為儘管資訊更加流通,決策品質卻在下降,其核心因素在於環境中充滿強大對手時所產生的「偏執」。這可以用「檸檬市場」模型來解釋:當欺詐者混入市場,我必須不斷懷疑對方如何試圖坑害我,這種疑慮最終可能蔓延到所有檢驗機制,導致信任全面崩潰。

人們有時會犯錯。(需要引用)

對於大多數錯誤,顯而易見的解釋是人們無法獲得足夠的資訊來避免錯誤,或者不夠聰明,無法透徹思考其行為的後果。

這預測了隨著決策者獲得更多資訊,或被更聰明的人取代,他們的決策將會變得更好。

而這在很大程度上是正確的!今天的市場似乎比互聯網出現前更有效率,總體而言,各個領域的決策在許多維度上都有所提高。

但我認為,在許多領域,儘管獲得了更多資訊,儘管勞動力市場規模更大、教育程度更高、汽油中去除了鉛,以及許多其他通常應使決策者更稱職、更聰明的事物,決策品質反而變差了。決策品質中存在大量的變異,無法單靠行動者對問題領域掌握多少資訊以及他們有多聰明來解釋。

我目前認為,解釋大部分剩餘變異的因素是「偏執」(paranoia)。特別是那種隨著你的環境中充滿更多稱職的對手而變得更具適應性的偏執。雖然我無疑無法完全傳達我為何相信這一點,但我希望至少能介紹一些我用來思考這個問題的概念。

檸檬市場

關於偏執最簡單的經濟模型是經典的「檸檬市場」(lemon's market):

在經典的檸檬市場故事中,你(和一群其他人)正試圖出售一些優質的二手車,而另一些人正試圖購買優質二手車,每個人都為能進行正和貿易(positive-sum trades)感到高興。接著,一群有缺陷的二手車(「檸檬」)進入了市場,這些車很難與高品質二手車區分開來,因為二手車存在的問題通常很難被察覺。

隨著市場中汽車的平均品質下降,買家會下調他們的出價意願。這導致更多的高品質賣家離開市場,因為他們不再認為自己的車值得以那種低價出售。這進一步降低了買家的平均出價意願,進而將更多高品質賣家趕出市場。最終,市場上只剩下檸檬在交易。

在這個經典模型中,一個運作良好、買賣雙方都樂於交易並為所有人創造大量剩餘的市場,可能會因為引入相對少數銷售低品質商品的敵對賣家而被擾亂甚至完全摧毀^([1])。從消費者的角度來看,這就像是你前一天還在開心地買二手車,第二天卻面對一大堆好到令人起疑的交易,以至於你知道事有蹊蹺(而你是對的)。

在檸檬市場買車是一場持續的練習,試圖弄清楚對方打算如何坑你。如果你看到一輛車的報價很低,這既是你撿到便宜的證據,也是交易對手知道一些你不知道的事情並利用這些資訊來坑你的證據。如果後者超過了前者,交易就不會發生。

出於某種原因,理解這種簡單的動態對人們來說出奇地難以接受。事實上,維基百科關於艾克羅夫(Akerlof)這篇開創性論文的評價章節極具教育意義:

《美國經濟評論》(American Economic Review)和《經濟研究評論》(Review of Economic Studies)都以「瑣碎」為由退回了這篇論文,而《政治經濟學雜誌》(Journal of Political Economy)的審稿人則認為其錯誤,理由是如果這篇論文是正確的,那麼就沒有商品可以交易了。^([4]) 直到第四次嘗試,這篇論文才在《經濟學季刊》(Quarterly Journal of Economics)上發表。^([5]) 今天,這篇論文是現代經濟理論中引用次數最多的論文之一,也是 RePEC 中有史以來下載次數最多的經濟學期刊論文(截至 2022 年 2 月,學術論文引用次數超過 39,275 次)。^([6]) 它深刻影響了幾乎所有的經濟學領域,從產業組織和公共財政到宏觀經濟學契約理論(你知道一篇論文是好論文,如果它同時因為「瑣碎」和「顯然錯誤」而被退稿)

話雖如此,在現實中,應對檸檬市場並不難。只需檢查汽車以區分爛車和好車,那麼汽車的市場價格最多只會停留在檸檬賣家出現前的均衡價格,加上確認它不是檸檬的檢查成本。還不算太糟。

「但等一下!」檸檬車推銷員說。「你不知道嗎?我也兼營汽車檢查業務」。你禮貌地微笑點頭,然後在意識到真相時停下了腳步。「噢,我們剛開了一家認證機構,專門認證我們的檢查員絕對合法」,他說,而你此時正尋找飛往最近共產主義國家的航班。

處處皆檸檬

如果你身處的世界不僅有可疑的二手車推銷員,還有可疑的二手車檢查員,以及可疑的二手車檢查員評級機構,或者更廣泛地說,存在著稱職的對手,他們會預測你用來定位世界的任何方法,並旨在為了自己的目標而破壞它,你會怎麼做?

就我所知,答案是「我們真的不知道,這看起來真他媽的難,抱歉了」。如果你處於一個環境中,其中有其他聰明的行動者^([2])試圖預測你的行為,然後向你提供資訊以榨取資源,目前還沒有明確的解決方案。決策論和博弈論在很大程度上仍是未解決的問題,大多數對抗性博弈都沒有明確的解法。

但顯然,在實踐中,人們總有辦法應對。這篇文章的其餘部分旨在傳達處理這種情況的感覺,以及從外部看是什麼樣子。這些「解決方案」雖然通常是合適的,但往往看起來很瘋狂,而這種瘋狂解釋了為什麼儘管我們變得更聰明、資訊更豐富,世界卻未能變得更好。這些策略通常涉及讓自己變得更笨,以便讓自己更不容易被利用,而且你的對手越聰明,這些策略就越誘人。

戰鬥機與 OODA 循環

美國空軍上校約翰·柏德(John Boyd)試圖找出誰能在戰鬥機纏鬥中獲勝的良好預測指標。為了追求這一目標,他花了 30 年時間發表研究報告和論文並培訓新兵,最終形成了他的「OODA 循環」模型。

在這個模型中,戰鬥機飛行員參與一個持續的循環:察(Observe)、位(Orient)、策(Decide)、動(Act)。這個循環通常在幾秒鐘內完成,飛行員觀察新資訊,針對新環境進行定位,做出如何回應的決策,並最終採取行動。然後他們再次觀察(包括自己行動的後果和對手的後果),再次定位,依此類推。

根據柏德的說法,決定誰在近距離纏鬥中獲勝的因素是哪位飛行員能「進入」另一位飛行員的 OODA 循環。

如果你能……

  • 採取難以觀察的行動……
  • 讓人更難定位……
  • 並在對手決定下一步行動之前採取行動

你就會贏得戰鬥。或者正如柏德所說:「能處理最快變化率的人才能生存」。值得稱讚的是,他基於這一理論建立的戰鬥機機動性正式模型(至少根據維基百科)已成為現代戰鬥機設計(包括 F-15 和 F-16)的指導原則之一,並被廣泛認為決定了許多現代戰場策略。

除了偶爾參與的戰鬥機纏鬥外,我發現這個模型有助於理解在各種領域中偏執的主觀體驗。你正試圖運行你的 OODA 循環,但你被對手包圍,他們同時試圖破壞你的 OODA 循環,同時加快他們自己的循環。當他們進入你的 OODA 循環時,感覺就像你被對手操縱了,他們預測你行為的速度比你適應的速度還要快。

失敗的感覺是一種迷失方向和混亂感,以及隨著現實變化快於你的定位速度而不斷重新定位,並伴隨著拼命嘗試以某種方式減慢對手干擾你的速度。


人們對這種對抗性資訊環境有很多不同的反應方式,但從高層次來看,我覺得大致有三種主要策略:

  • 你讓自己對資訊視而不見
  • 你試圖消除欺騙的來源
  • 你試圖變得不可預測

這三種策略從外部看都會產生相當瘋狂的行為,但我認為它們大體上是對抗性環境的適當反應(儘管遠非最優)。

你嘗試的第一件事是讓自己視而不見

當二手車市場變成檸檬市場時,你就不買二手車。當你是一位與外國開戰的將軍,而你懷疑你的間諜已被收買並向你提供旨在欺騙你的資訊時,你就直接忽略你的間諜。當你擔心你的新聞是強大的政治集體意識(egregores)旨在將你極化到特定政治立場的產物時,你就停止閱讀新聞。

在偏執的極端,住著與世隔絕的隱士。樹木和蝴蝶(大多)不會試圖欺騙你,你可以直接從第一原理出發推論世界上正在發生什麼。

雖然這種極端做法代價高昂,但我們在更溫和的形式中經常看到這種情況。

我在 2020 年初對 COVID 的經歷涉及大量對各種資訊來源的自我屏蔽。1 月份,隨著大流行病開始成為不久將來的明顯問題,圍繞 COVID 的討論升溫。資訊品質並不完美,但總體而言,如果你想了解 COVID 或一般的呼吸道疾病,你的體驗會還不錯。事實上,我在大流行初期用來思考 COVID 可能影響的許多研究都是由 CDC 直接產生的。

接著,大流行病對世界其他地方變得顯而易見,大量的人開始有興趣塑造其他人對 COVID 的看法。CDC 開始在口罩的有效性上撒謊,以說服人們停止使用,以便在政治壓力增加時讓服務業人員能夠獲得口罩。社會的大部分群體開始擦拭每個表面,並拼命嘗試產生使這種行為合理化的證據。大多數人們依賴可靠健康資訊的渠道變成了檸檬市場,因為宣傳力量淹沒了那些仍旨在直接提供資訊的人。

我開始忽略 CDC 說的基本上任何話。我確信那裡仍有許多優秀的科學家在工作,但我沒有能力區分好壞。隨著對抗壓力的增加,我發現最好讓自己對那些資訊視而不見。

在對抗性環境中讓自己對資訊視而不見的普遍好處是如此普遍地被感受到和廣泛地被認可,以至於限制資訊渠道幾乎是每個大型社會制度的一部分:

美國法院廣泛限制可以向陪審團展示的證據

美國法律先例中很大一部分圍繞著「可採納證據」(admissible evidence)的概念,甚至還有「可採納辯論」。我們偏執於陪審團被誤導,因此我們讓陪審團對與他們被要求評判的案件相關的大多數證據視而不見,希望能保護他們不被任何一方的律師欺騙和控制,但仍留下足夠的資訊來做出通常足夠的判斷。

不允許任何人提供法律或醫療建議

雖然這在很大程度上是監管俘虜(regulatory capture)的結果,但我們仍然高度限制人們在許多對人們最重要的話題上被允許提供給他人的資訊。醫療建議和法律建議都是我們只允許認證專家自由發言的類別,即便如此,我們也只有在配合強烈譴責(如果建議後來給接收者帶來糟糕後果)的情況下才這樣做。

在政府內部,「官方數據」往往是唯一重要的事情

CIA 分析師塞繆爾·亞當斯(Samuel Adams)試圖向詹森政府通報美國在越南戰爭中面臨的對手人數的故事,在這裡很有啟發性。正如亞當斯自己講述的故事,當他發現他認為非常強大的證據表明越南軍隊的人數遠多於之前的假設(60 萬對 25 萬戰鬥人員)時:

我目瞪口呆,衝進喬治·卡弗(George Carver)的辦公室,獲得了修正數字的許可。我沒有使用我自己的總數 60 萬,而是使用了 50 萬,這更符合霍金斯上校在檀香山所說的。即便如此,研究局的一位首席副局長德雷塞爾·戈弗雷(Drexel Godfrey)打電話給我說,研究局不能使用 50 萬,因為「那不是官方的」。

[...]

西貢會議進入第三天時,我們收到了赫爾姆斯(Helms)發來的一封電報,儘管電報中充滿了委婉說法,但**讓我們別無選擇,只能接受軍方的數字。**我們照做了,會議得出的結論是南越越共軍隊的規模為 29.9 萬人。

[...]

1969 年 1 月尼克森就職幾天後,我將報告送到赫爾姆斯的辦公室,請求允許將其送往白宮。副局長魯弗斯·泰勒(Rufus Taylor)海軍上將在一封信中拒絕了許可,他通知我 CIA 是一個團隊,如果我不願意接受團隊的決定,那麼我就應該辭職。當政府在許多行動者都有理由將數據向自己方向造假的環境中運作資訊時,他們會高度限制哪些資訊是辯論和計算的合法基礎,如上述例子所示。

你嘗試的第二件事是清除不值得信任的人

下一件要嘗試的事情是剔除那些試圖欺騙你的人。這……有時進展得相當順利。大多數功能正常的組織確實會相當積極地懲罰撒謊和欺騙。但發現老練的欺騙或不忠是非常困難的。麥卡錫主義和第二次紅色恐慌就是一個有趣的例證:

總統哈里·S·杜魯門於 1947 年 3 月 21 日頒布的第 9835 號行政命令,要求對所有聯邦公務員進行「忠誠度」審查。該命令稱,確定不忠的一個依據是發現與司法部長確定的任何「極權主義、法西斯主義、共產主義或顛覆性」組織,或主張或批准武力剝奪他人憲法權利,或尋求「以違憲手段改變美國政府形式」的組織有「成員關係、隸屬關係或同情關聯」。^([10])

後來被稱為麥卡錫時代的時期在麥卡錫成名之前就開始了。隨著戰時與蘇聯的東西方聯盟破裂,且許多人仍記得第一次紅色恐慌,總統哈里·S·杜魯門於 1947 年簽署了一項行政命令,審查聯邦僱員是否可能與被視為「極權主義法西斯主義共產主義顛覆性」的組織有關聯,或主張「以違憲手段改變美國政府形式」。在某些時候,當你身邊的人都在對抗性地向你提供資訊並破壞你的計劃時,你就開始清洗人員,直到你覺得自己再次掌握了情況。

這從外部看同樣可能顯得完全瘋狂,許多無辜的人被捲入戰火,充滿了痛苦和掙扎。

但如果你確實被許多間諜包圍,要抓獲所有間諜是非常困難的!這一時期羅森堡夫婦(Rosenbergs)的故事很好地說明了這一點:

朱利葉斯·羅森堡(Julius Rosenberg,1918 年 5 月 12 日-1953 年 6 月 19 日)和艾瑟爾·羅森堡(Ethel Rosenberg,原姓 Greenglass;1915 年 9 月 28 日-1953 年 6 月 19 日)是一對美國夫婦,他們被判定為蘇聯從事間諜活動,包括提供有關美國雷達聲納噴射推進引擎和核武器設計的絕密資訊。他們於 1953 年在紐約州奧西寧新新懲教所的州執行室被美國聯邦政府處決^([1]),成為首批因這類指控被處決的美國平民,也是首批在和平時期被處決的人。羅森堡夫婦的定罪導致了全國對麥卡錫主義的巨大抵制,這在麥卡錫主義作為政治過度擴張和不當偏執時期的遺產形成中發揮了重要作用:

在《國家衛報》(National Guardian)發表了一系列調查報導並成立了羅森堡案正義保障全國委員會後,一些美國人開始相信羅森堡夫婦是無辜的,或者判刑過重,特別是艾瑟爾。一場試圖阻止處決這對夫婦的運動開始了。在審判和處決之間,發生了廣泛的抗議和反猶主義的指控。在美國人對共產主義恐懼高漲的時期,羅森堡夫婦沒有得到主流猶太組織的支持。美國公民自由聯盟在該案中未發現任何侵犯公民自由的情況。^([37])

在世界各地,特別是在西歐各國首都,發生了許多支持羅森堡夫婦的糾察和示威抗議,以及原本親美報紙的社論。獲得諾貝爾文學獎的存在主義哲學家和作家讓-保羅·沙特將這次審判描述為「法律上的私刑」。^([38]) 其他人,包括非共產主義者如讓·谷克多和諾貝爾獎獲得者物理化學家哈羅德·尤里^([39]),以及左翼人士——有些是共產主義者——如納爾遜·艾格林貝托爾特·布萊希特阿爾伯特·愛因斯坦達許·漢密特芙烈達·卡蘿迪亞哥·里維拉,都對美國政府在法國人稱之為美國版德雷福斯事件中的立場表示抗議。^([40]) 愛因斯坦和尤里懇求總統哈里·S·杜魯門特赦羅森堡夫婦。1951 年 5 月,巴勃羅·畢卡索在法國共產黨報紙《人道報》(L'Humanité)上寫道:「小時在流逝。分鐘在流逝。不要讓這場反人類罪行發生。」^([41]) 全黑人工會國際碼頭工人協會 968 分會停工一天以示抗議。^([42]) 電影藝術家如弗里茨·朗也表達了抗議。^([43])幾十年後的 1995 年,作為解密資訊發布的一部分,公眾收到了羅森堡夫婦確實是間諜的確認:

維諾那計劃是美國的一項反情報計劃,旨在破解蘇聯情報機構傳輸的訊息。該計劃始於蘇聯還是美國盟友時,並在蘇聯被視為敵人期間的冷戰時期繼續進行。^([67]) 維諾那訊息並未出現在羅森堡夫婦的審判中,審判依賴於其合作者的證詞,但這些訊息極大地影響了美國政府調查和起訴國內共產主義者的整體方法。^([68])

1995 年,美國政府公開了許多由維諾那計劃解碼的文件,顯示了朱利葉斯·羅森堡作為一個高效間諜網成員的角色。^([69]) 例如,一封 1944 年的電報(其中以明文給出了魯斯·格林格拉斯的名字)說,魯斯的丈夫大衛正被他的姐姐(即艾瑟爾·羅森堡)和她的丈夫招募為間諜。電報還明確指出,姐姐的丈夫參與間諜活動的程度足以擁有自己的代號(「Antenna」,後改為「Liberal」)。^([70]) 艾瑟爾沒有代號;^([26]) 然而,維諾那計劃中包含的亞歷山大·瓦西里耶夫檔案中的 KGB 訊息(直到 2009 年才公開)^([71])^([72])顯示,艾瑟爾和朱利葉斯都與至少兩名 KGB 特工保持定期聯繫,並積極招募大衛·格林格拉斯和羅素·麥克納特^([73])^([71])^([72])事實證明,要證明某人是間諜真的很難。儘管如此,嘗試這樣做往往會讓人變得更加偏執,從而產生更強烈的免疫反應,並導致人們對證據的反應變得遲鈍,進而滋生更多對抗性直覺並引發更多清洗。

但要明確的是,很多時候,這是對對抗性環境的一種理智反應。如果你是一位被任命領導一個功能失調組織的 CEO,裁掉基本上所有吸收了對抗性文化的員工,很可能是一個正確的決定。只是要極其小心,不要清洗得太過火,以至於最後只剩下一堆稱職的陰謀家。

第三件要嘗試的事情是變得不可預測且具有報復性

最終,如果你處於對手不斷試圖控制你的行為並進入你的 OODA 的境地,你總是可以開始表現得不可預測。如果你無法預測自己明天要做什麼,你的對手(可能)也無法預測。

尼克森的「瘋狗策略」是這方面一個有趣的證明:

我稱之為瘋子理論,鮑勃。我要北越人相信我已經到了一個為了停止戰爭可以做任何事情的地步。我們只需向他們傳話說:「看在上帝的份上,你知道尼克森對共產主義著了迷。他生氣時我們攔不住他——而且他的手就放在核按鈕上」,胡志明本人兩天後就會出現在巴黎乞求和平。控制一個不可預測的對手,比控制一個為了追求採取最優且看起來理智的行動而表現得完全可預測的對手要難得多。將你的策略隨機化是許多對抗性博弈的解決方案,而在現實中,讓自己在整合哪些資訊、忽略哪些資訊,以及啟動武力的觸發點在哪裡變得不可預測,往往會讓你的對手別無選擇,只能變得更加保守,或者減輕壓力,或者旨在操縱如此多的資訊以至於連隨機化也救不了你。


現在,這讓我們得出了什麼結論?首先,我認為這有助於解釋世界上的許多現象,並讓我們能更好地預測未來會如何發展。

但我認為更具體地說,這激發了我內心深處珍視的一個原則:「不要成為那種迫使他人變得偏執的行動者」。

偏執的人會搞砸他們周圍的一切。從偏執中解脫出來非常困難且需要很長時間。我人生哲學中很大一部分是為了避免進入迫使我變得偏執的環境,並儘可能減少周圍人的偏執。

  • ^(^)艾克羅夫模型的幼稚應用預測了一個零交易量的市場!儘管假設存在大量的正和貿易,但完全沒有「好桃子」被交易。

  • ^(^)或者甚至是比你更聰明、更堅定的行動者。

Lesswrong

相關文章

  1. 對角化:一個(稍微)更嚴謹的偏執模型

    5 個月前

  2. 門檻比你想像的還要低

    19 天前

  3. 研究發現 AI 模型在面臨被替換時會改變標準以展現自我保護偏見

    Rohan Paul · 17 天前

  4. 正和惡性定律

    大約 1 個月前

  5. 選取效應的分類

    5 個月前