每個人都有計畫，直到被社會壓力迎面痛擊

Lesswrong·4 天前

AI 生成摘要

我認為大多數人在做決策時最大的盲點是社會壓力的被動作用，這種隱形的共識就像恆定的重力，會削弱個人的表現並將預測轉化為目標。即使是像 Anthropic 團隊這樣優秀的人才，若不刻意練習抵抗這種社會現實，也難以避免被大眾共識所同化，因此我們必須透過理性工具與環境選擇來積極對抗這種傾向。

標題：隱形的社會共識是真實存在的，而且會傷害你

相關閱讀：《煩人的原則主義者，以及他們的遭遇》，無論就其主張而言，還是就我在這裡肯定扮演了 Alice 和/或 Alex 的角色而言。

我認為大多數人在做決定時（無論是關於做什麼，還是關於在意什麼）最大的盲點，就是社會壓力的被動角色。主動的社會壓力很煩人，大多數人都能察覺到，而且如果他們願意，可以進行反擊。這其中有幾個難題：你必須意識到社會壓力和社會現實與物理現實是分開的；你必須察覺到自己真正想要什麼，並將其與被告知應該想要的東西區分開來；你還必須真正拿出勇氣去反擊。這並不容易。但在一定的智力水平上，這樣做的好處是顯而易見的：只做環境獎勵的事情是無法成就任何新事物的，而每一項進步都是一種改變。基於這些及其他原因，許多人都做到了這一點。（為他們感到高興！）

但這並非反抗社會壓力的終點。成為一個堅持讓環境適應自己的「不理性的人」是一個好的開始。但你仍然面臨一個陷阱：被動的社會壓力定義了什麼是「理性」。這不像許多主動壓力那樣是可以贏一次就結束的戰鬥；它像恆定的重力，你必須時刻保持警惕。你必須主動經營你所看重的人際環境來與之對抗，而且我不確定「家裡有好人，工作中有壞人」這種模式是否行得通。

讓我舉個例子。奈特·席佛（Nate Silver）是媒體界最始終如一地準確且「不理性」的人之一。他追隨數據得出結論，而當他沒做到時，他會承認錯誤並更加致力於追求正確。我對他的尊重不亞於我對新聞界、Substack 或其他任何地方的任何人的尊重。^([1]) 當他將 FiveThirtyEight 從一個匿名個人部落格發展成一個大型新聞機構時，整體的表現不如他個人作品那麼出色；它依然很好，通常在不計後果地追隨數據和邏輯以尋求真相方面表現更佳，但就是不如他本人。這沒關係，那種完美本就不可能發生。然而，從很早期開始，就有一個明顯的第二名：哈利·恩滕（Harry Enten）。憑藉著他獲得的「神童」稱號以及作為首批員工之一的身分，我想席佛也知道這一點。第三名大概是加倫·德魯克（Galen Druke），但差距要大得多。

但這只是鋪陳。轉折在於：哈利·恩滕於 2018 年 2 月離開 FiveThirtyEight 前往 CNN。而到了 2018 年 5 月，奈特·席佛自己的報導水平就出現了明顯的下滑。

它依然非常出色。毫無疑問比我能做的要好。但在那之前，它的水平大約等同於現在的 Silver Bulletin，而在那之後則變差了，緩慢下降後在某個點進入平台期。我很想給你一個確切的日期，但這很難衡量。不過，我懷疑奈特本人也會同意。缺乏堅持高質量數據驅動、邏輯驅動分析的社會壓力，讓他表現得更差了。

我最近與一些在 Anthropic 工作的理性且聰明的人發生了爭論。我看到他們被拿來與「AI 2027」的預測進行比較（預測近得嚇人，而現實甚至超前於進度），我說：「保證你們不會把它當作目標？」他們的反應就像我在指責他們異常膽小或異常容易受壓力動搖一樣。他們給了我一清單的理由，說明為什麼他們認為不需要擔心。結果我現在比以前更擔心了。三十年來，摩爾定律像時鐘一樣精準運行，年復一年。這並非因為它是自然趨勢；如果是自然趨勢，它只會是大約接近。它幾乎是鋼鐵般的定律，是因為整個產業將其視為目標。 存在一種背景社會預期，認為這就是微處理器價格和規模改進的適當增長率。我幾乎可以肯定，有很多晶片設計師會告訴你，當他們稍微超前進度時，他們和落後進度時一樣努力創新，而從結果來看，他們錯了。 這絕非孤立事件。跑者幾十年來都無法突破四分鐘一英里的紀錄；這被認為是不可能的。然後紀錄被打破了一次，就像閘門被打開了一樣。沒有人明確向頂尖跑者施壓讓他們不要嘗試；他們只是假設共識是理性的，並在不知不覺中因雄心受挫而氣餒。醫學界對此更是臭名昭著，尤其是飲食醫學——證據早在實踐改變之前就已經轉向，然後一變再變。有些人歸咎於遊說，但這顯然是胡說八道；醫生太多了，根本遊說不完。沒有人強迫他們堅持共識；這只是在背景中發生的。

所以，不，我不覺得他們認為 Anthropic 不會追隨這個目標的理由令人安心。我相信 Anthropic 的團隊具有非凡的道德感、非凡的智力，以及整體的超常理性。他們並非異常容易被共識左右。但這還不夠；你必須主動篩選出那些難以被左右的人，而當你主要篩選的是你能找到的最優秀、最有道德的工程師時，除非這是一個明確的目標，否則你不會具備這種特質。Anthropic 的大多數人沒讀過 AI 2027？當然，無所謂，不需要很多人讀過。原則上，甚至可以一個人都沒讀過。只要其他人在公開進行比較，十幾個高管讓 Claude Sonnet 4.0 幫他們總結一下就足夠了。不需要有人真正推你，你就會被推著走。

Anthropic 不會打算將 AI 2027 的預測（除非事情進展得非常非常不可思議地順利，否則該預測以人類終結告終）視為目標。那不是計劃。但每個人都有一個計劃，直到社會壓力迎面而來。你可以篩選對此有抵抗力的人。我個人比大多數人對此稍微更有抵抗力，這幫助我看得更清楚，但我看到的主要是連我都多麼容易受到影響，以及其他人是多麼極度容易受到影響。要抵抗這一點，除非你非常老練，否則就必須被視為一個混蛋，因為當其他人都被推著走，而你卻在沒有顯而易見的理由下站穩腳跟並拒絕時，那就是混蛋行為。 你在無緣無故地刁難！對抗那些完全正常且理性的事情！你為什麼要那樣做，你這個混蛋？

我非常確定，除非你對所有認為你應該改變的人抱持徹底的蔑視，否則不可能免疫。這對於改變你的想法並非好事，除非你是那種能獨自推導出全新研究領域的不可思議的天才。考慮到約翰·馮·諾伊曼（John von Neumann）儘管聽取了許多合理的論點，卻仍有著臭名昭著的冒險行為，這對你來說可能也行不通。另一方面，如果你是反社會人格者，好消息！如果你在社會中運作，你天生就擁有這種能力。

但為了具備抵抗力，你能做什麼？LessWrong 式的理性有所幫助；關注你的大腦是在受損的硬體上運行的事實，用你心智的鏡頭審視自身，觀察你的信念如何為了讓事情變得更方便而產生偏移。如果可以的話，保持記錄是有幫助的——你相信什麼，以及你當時說為什麼相信它。這樣你以後可以回頭檢查，也因為信念被固定在紙上比在腦中漂浮更容易追蹤。懷疑你的懷疑，然後再懷疑那些懷疑，並對自己採取安全心態，最終你會變得更擅長此道。正如我提到的 FiveThirtyEight 的例子，找至少一個同樣優秀的親密朋友和合作者，互相強化；爭論、編輯、批評，互相測試。

但我也知道……也許只有一個人，在不成為混蛋的情況下變得很擅長此道。^([2]) 我指的不是那種「雖然看起來像混蛋但我有充分理由」的混蛋。就是那種普通的、會為了微小的個人便利而破壞你一天心情的混蛋。你最終可以達到那個境界，但你必須練習抵抗社會壓力，才能變得足夠優秀，從而能看透壓力並決定在這裡抵抗是否值得、是否正確。在通往那裡的路上，你不會幸運到每次都猜對，而且你可能還不夠優秀，無法在反抗不重要的事情時不惹惱那些有權生氣的人。^([3])

而且即使你達到了那個境界，即使你沒有採取立場，你的說服力也會降低。這似乎並非不可避免。是技巧問題。但似乎也有充分的理由解釋為什麼會這樣。將自己與預設的社會現實區分開來，是抵抗所必需且固有的。要抵抗錯誤的近似共識，你本質上就在將自己區隔開來。但這會讓你脫離每個人共享的假設，而那些假設——迎合它們並將其作為共同基礎——是說服性寫作和演講中的常用工具。它們是非常有價值的修辭工具，但更重要的是，它們是潛意識的工具。大多數認知發生在言辭之前的層面；你沒有時間經常召喚那個將事物轉化為明確概念的意識戰略規劃者。大多數時候你使用的是系統 1，而非系統 2，而且要在你審慎、分析性的系統 2 中擁有不同的假設，卻仍能在系統 1 中使用共享的假設，是非常非常困難的。這意味著你的肢體語言、隨口的自動選詞等等，都會顯得有些格格不入。

我的部落格取名為《危險的真誠》（Dangerous Sincerity），這就是你的真誠變得危險的情況之一。社會現實比物理現實次要且滯後。但它——社會共識——仍然是真實的，無論你是否看見它，它都能傷害你。如果你違抗它，它就會傷害你。如果可以的話，最好建立系統，並讓自己周圍有一群同樣在努力的夥伴。而且，特別是如果你正在創造某種若不夠小心就可能毀滅世界的東西，請不斷地檢查、再檢查。

然後，也許在關鍵時刻，你會具備足夠的偏執。

^(^) 在這個層級的人中，我也會放入 Zvi Mowshowitz、Sarah Constantin 和 Kelsey Piper，按「不理性」程度遞減及相應的說服能力遞增排序。
^(^) Kelsey Piper。Kelsey 表現得足夠老練，也許從不需要成為混蛋就能達到那個境界，但她也是我提到的頂尖四人中最不具備抵抗力的一個。
^(^) 是的，我年輕時就這麼做過。我當時也在做有原則的事，但我肯定在其他方面是個混蛋。不要把這條建議當作拒絕任何事情的許可證。至於我現在在與 Anthropic 那些人的爭論中是否無故成為混蛋，就留給 Claude Mythos 7 之類的東西去練習吧，因為我確實不知道。

參與討論

— Lesswrong

其他收藏 · 0

收藏夾

你的個人知識庫

每個人都有計畫，直到被社會壓力迎面痛擊