每個人都有計畫,直到被社會壓力迎面痛擊

Lesswrong·

AI 生成摘要

我認為大多數人在做決策時最大的盲點是社會壓力的被動作用,這種隱形的共識就像恆定的重力,會削弱個人的表現並將預測轉化為目標。即使是像 Anthropic 團隊這樣優秀的人才,若不刻意練習抵抗這種社會現實,也難以避免被大眾共識所同化,因此我們必須透過理性工具與環境選擇來積極對抗這種傾向。

標題:隱形的社會共識是真實存在的,而且會傷害你

相關閱讀:《煩人的原則主義者,以及他們的遭遇》,無論就其主張而言,還是就我在這裡肯定扮演了 Alice 和/或 Alex 的角色而言。

我認為大多數人在做決定時(無論是關於做什麼,還是關於在意什麼)最大的盲點,就是社會壓力的被動角色。主動的社會壓力很煩人,大多數人都能察覺到,而且如果他們願意,可以進行反擊。這其中有幾個難題:你必須意識到社會壓力和社會現實與物理現實是分開的;你必須察覺到自己真正想要什麼,並將其與被告知應該想要的東西區分開來;你還必須真正拿出勇氣去反擊。這並不容易。但在一定的智力水平上,這樣做的好處是顯而易見的:只做環境獎勵的事情是無法成就任何新事物的,而每一項進步都是一種改變。基於這些及其他原因,許多人都做到了這一點。(為他們感到高興!)

但這並非反抗社會壓力的終點。成為一個堅持讓環境適應自己的「不理性的人」是一個好的開始。但你仍然面臨一個陷阱:被動的社會壓力定義了什麼是「理性」。這不像許多主動壓力那樣是可以贏一次就結束的戰鬥;它像恆定的重力,你必須時刻保持警惕。你必須主動經營你所看重的人際環境來與之對抗,而且我不確定「家裡有好人,工作中有壞人」這種模式是否行得通。

讓我舉個例子。奈特·席佛(Nate Silver)是媒體界最始終如一地準確且「不理性」的人之一。他追隨數據得出結論,而當他沒做到時他會承認錯誤並更加致力於追求正確。我對他的尊重不亞於我對新聞界、Substack 或其他任何地方的任何人的尊重。^([1]) 當他將 FiveThirtyEight 從一個匿名個人部落格發展成一個大型新聞機構時,整體的表現不如他個人作品那麼出色;它依然很好,通常在不計後果地追隨數據和邏輯以尋求真相方面表現更佳,但就是不如他本人。這沒關係,那種完美本就不可能發生。然而,從很早期開始,就有一個明顯的第二名:哈利·恩滕(Harry Enten)。憑藉著他獲得的「神童」稱號以及作為首批員工之一的身分,我想席佛也知道這一點。第三名大概是加倫·德魯克(Galen Druke),但差距要大得多。

但這只是鋪陳。轉折在於:哈利·恩滕於 2018 年 2 月離開 FiveThirtyEight 前往 CNN。而到了 2018 年 5 月,奈特·席佛自己的報導水平就出現了明顯的下滑。

它依然非常出色。毫無疑問比我能做的要好。但在那之前,它的水平大約等同於現在的 Silver Bulletin,而在那之後則變差了,緩慢下降後在某個點進入平台期。我很想給你一個確切的日期,但這很難衡量。不過,我懷疑奈特本人也會同意。缺乏堅持高質量數據驅動、邏輯驅動分析的社會壓力,讓他表現得更差了。

我最近與一些在 Anthropic 工作的理性且聰明的人發生了爭論。我看到他們被拿來與「AI 2027」的預測進行比較(預測近得嚇人,而現實甚至超前於進度),我說:「保證你們不會把它當作目標?」他們的反應就像我在指責他們異常膽小或異常容易受壓力動搖一樣。他們給了我一清單的理由,說明為什麼他們認為不需要擔心。結果我現在比以前更擔心了。三十年來,摩爾定律像時鐘一樣精準運行,年復一年。這並非因為它是自然趨勢;如果是自然趨勢,它只會是大約接近。它幾乎是鋼鐵般的定律,是因為整個產業將其視為目標。 存在一種背景社會預期,認為這就是微處理器價格和規模改進的適當增長率。我幾乎可以肯定,有很多晶片設計師會告訴你,當他們稍微超前進度時,他們和落後進度時一樣努力創新,而從結果來看,他們錯了。 這絕非孤立事件。跑者幾十年來都無法突破四分鐘一英里的紀錄;這被認為是不可能的。然後紀錄被打破了一次,就像閘門被打開了一樣。沒有人明確向頂尖跑者施壓讓他們不要嘗試;他們只是假設共識是理性的,並在不知不覺中因雄心受挫而氣餒。醫學界對此更是臭名昭著,尤其是飲食醫學——證據早在實踐改變之前就已經轉向,然後一變再變。有些人歸咎於遊說,但這顯然是胡說八道;醫生太多了,根本遊說不完。沒有人強迫他們堅持共識;這只是在背景中發生的。

所以,不,我不覺得他們認為 Anthropic 不會追隨這個目標的理由令人安心。我相信 Anthropic 的團隊具有非凡的道德感、非凡的智力,以及整體的超常理性。他們並非異常容易被共識左右。但這還不夠;你必須主動篩選出那些難以被左右的人,而當你主要篩選的是你能找到的最優秀、最有道德的工程師時,除非這是一個明確的目標,否則你不會具備這種特質。Anthropic 的大多數人沒讀過 AI 2027?當然,無所謂,不需要很多人讀過。原則上,甚至可以一個人都沒讀過。只要其他人在公開進行比較,十幾個高管讓 Claude Sonnet 4.0 幫他們總結一下就足夠了。不需要有人真正推你,你就會被推著走。

Anthropic 不會打算將 AI 2027 的預測(除非事情進展得非常非常不可思議地順利,否則該預測以人類終結告終)視為目標。那不是計劃。 但每個人都有一個計劃,直到社會壓力迎面而來。 你可以篩選對此有抵抗力的人。我個人比大多數人對此稍微更有抵抗力,這幫助我看得更清楚,但我看到的主要是連我都多麼容易受到影響,以及其他人是多麼極度容易受到影響。要抵抗這一點,除非你非常老練,否則就必須被視為一個混蛋,因為當其他人都被推著走,而你卻在沒有顯而易見的理由下站穩腳跟並拒絕時,那就是混蛋行為。 你在無緣無故地刁難!對抗那些完全正常且理性的事情!你為什麼要那樣做,你這個混蛋?

我非常確定,除非你對所有認為你應該改變的人抱持徹底的蔑視,否則不可能免疫。這對於改變你的想法並非好事,除非你是那種能獨自推導出全新研究領域的不可思議的天才。考慮到約翰·馮·諾伊曼(John von Neumann)儘管聽取了許多合理的論點,卻仍有著臭名昭著的冒險行為,這對你來說可能也行不通。另一方面,如果你是反社會人格者,好消息!如果你在社會中運作,天生就擁有這種能力。

但為了具備抵抗力,你能做什麼?LessWrong 式的理性有所幫助;關注你的大腦是在受損的硬體上運行的事實,用你心智的鏡頭審視自身,觀察你的信念如何為了讓事情變得更方便而產生偏移。如果可以的話,保持記錄是有幫助的——你相信什麼,以及你當時說為什麼相信它。這樣你以後可以回頭檢查,也因為信念被固定在紙上比在腦中漂浮更容易追蹤。懷疑你的懷疑,然後再懷疑那些懷疑,並對自己採取安全心態,最終你會變得更擅長此道。正如我提到的 FiveThirtyEight 的例子,找至少一個同樣優秀的親密朋友和合作者,互相強化;爭論、編輯、批評,互相測試。

但我也知道……也許只有一個人,在不成為混蛋的情況下變得很擅長此道。^([2]) 我指的不是那種「雖然看起來像混蛋但我有充分理由」的混蛋。就是那種普通的、會為了微小的個人便利而破壞你一天心情的混蛋。你最終可以達到那個境界,但你必須練習抵抗社會壓力,才能變得足夠優秀,從而能看透壓力並決定在這裡抵抗是否值得、是否正確。在通往那裡的路上,你不會幸運到每次都猜對,而且你可能還不夠優秀,無法在反抗不重要的事情時不惹惱那些有權生氣的人。^([3])

而且即使你達到了那個境界,即使你沒有採取立場,你的說服力也會降低。這似乎並非不可避免。是技巧問題。但似乎也有充分的理由解釋為什麼會這樣。將自己與預設的社會現實區分開來,是抵抗所必需且固有的。要抵抗錯誤的近似共識,你本質上就在將自己區隔開來。但這會讓你脫離每個人共享的假設,而那些假設——迎合它們並將其作為共同基礎——是說服性寫作和演講中的常用工具。它們是非常有價值的修辭工具,但更重要的是,它們是潛意識的工具。大多數認知發生在言辭之前的層面;你沒有時間經常召喚那個將事物轉化為明確概念的意識戰略規劃者。大多數時候你使用的是系統 1,而非系統 2,而且要在你審慎、分析性的系統 2 中擁有不同的假設,卻仍能在系統 1 中使用共享的假設,是非常非常困難的。這意味著你的肢體語言、隨口的自動選詞等等,都會顯得有些格格不入。

我的部落格取名為《危險的真誠》(Dangerous Sincerity),這就是你的真誠變得危險的情況之一。社會現實比物理現實次要且滯後。但它——社會共識——仍然是真實的,無論你是否看見它,它都能傷害你。如果你違抗它,它就會傷害你。如果可以的話,最好建立系統,並讓自己周圍有一群同樣在努力的夥伴。而且,特別是如果你正在創造某種若不夠小心就可能毀滅世界的東西,請不斷地檢查、再檢查。

然後,也許在關鍵時刻,你會具備足夠的偏執。

  • ^(^) 在這個層級的人中,我也會放入 Zvi Mowshowitz、Sarah Constantin 和 Kelsey Piper,按「不理性」程度遞減及相應的說服能力遞增排序。

  • ^(^) Kelsey Piper。Kelsey 表現得足夠老練,也許從不需要成為混蛋就能達到那個境界,但她也是我提到的頂尖四人中最不具備抵抗力的一個。

  • ^(^) 是的,我年輕時就這麼做過。我當時也在做有原則的事,但我肯定在其他方面是個混蛋。不要把這條建議當作拒絕任何事情的許可證。至於我現在在與 Anthropic 那些人的爭論中是否無故成為混蛋,就留給 Claude Mythos 7 之類的東西去練習吧,因為我確實不知道。

參與討論

Lesswrong

相關文章

其他收藏 · 0

收藏夾