我批評了人工智慧安全社群中人們傾向於為了社交和心理安慰而優先選擇「生存風險主題」工作的現象,而非考量實際影響力,並警告這可能導致被操縱或浪費潛力。
有時候,在這一帶(某個以生存風險 x-risk 為主題的組織)工作的朋友會考慮離職。他們會問一群人:「我接下來該做什麼?」然後每個人都會七嘴八舌地提議其他可以加入的生存風險相關組織。對話的大部分內容會圍繞在誰正在招聘、薪水多少、工作與生活平衡如何,或者這個人的資歷是否符合該職位。
有時對話會集中在什麼對緩解生存風險有幫助,以及哪些地方被大家忽略了。但通常那不是重點。在這些對話中,人們似乎主要擔心自己在哪裡能發展得好。而我認為這往往是正確的考量。
大多數人並非處於衝刺模式或極短時間線模式;即便他們的模型支持這種做法,我認為他們也不知道如何在不拋棄理智或陷入帕斯卡賭注式自我恐嚇的情況下做到這一點。如果他們玩的是長線遊戲,計劃就不能是永遠進行不可持續的衝刺。如果人們能誠實面對自己的極限,大概能制定出更好的計劃。
但是,既然他們願意為了適配度(fit)而權衡掉這麼多影響力,令我驚訝的是,基本上沒有人提到去非生存風險組織工作或創業。即便被提起來,也顯得很敷衍:「你可以去非生存風險的地方工作」、「或許你可以去創業?」。這不像上述討論那樣貼近現實。沒有關於適配度的討論,甚至沒有具體的想法。
看起來人們並沒有真正考慮過外部選項。我認為這相當糟糕。人們一心想留在生存風險圈子裡,即便這在應對生存風險的邏輯上並不合理。
但是,如果你沒得到一份生存風險相關的工作,如果你去 Google 而不是 Anthropic 工作,你就不能去 Constellation,你不能在 Lighthaven 擁有辦公室,你會受到某些人的評判,你與社交圈的聯繫會變弱,受邀參加活動的次數會減少,而這可能會像滾雪球一樣導致更多的孤立。
聽著,想要待在那些對生存風險有覺知的人身邊是非常合理的。有些定位在孤身一人時很難完成。效法漢明(Hamming)「開著門工作」是個好主意,這樣你就能被動地接觸到新的想法和機會,那些真正有意義的機會。與對生存風險無感的人相處可能會讓人感到疏離。生存風險圈子在很多方面都是經過正向篩選的——這些特質可能你也有,所以想加入這個群體是合理的。而且,如果你在這裡工作了一段時間,你就會與這裡的人建立起許多個人和職業聯繫,而你可能想保留這些聯繫。
如果你從事生存風險相關的工作,即便你不相信日常工作的價值,它也能幫助你思考生存風險。或許因為你住在這、見到這些人,在腦中反覆思考這個問題會變得更容易。如果你對工作感到不滿,這種不滿的具體形式可能會告訴你,你真正想做的是什麼。
但人們低估了從事生存風險相關事務的危險。
這裡有一個危險:關鍵考量(crucial considerations)和符號翻轉(sign flips)很常見。也許如果你試圖制定許多利益團體都會支持的折衷政策,在關鍵時刻你將缺乏足夠的公信力。或者,在網路上表現得很怪異,可能意味著華盛頓特區沒人會認真對待 AI。也許在實驗室工作是唯一能對重要決策產生實際影響力的方式。或者,這只是提供了一塊遮羞布,讓他們更容易打發投訴,而你則被腐化並推動了他們的議程。
還有另一個危險,我認為可能更糟。如果你堅持要在生存風險相關的地方工作,你就是在要求別人把你當成傻瓜。
我上大學時曾被搶劫。幾天後的傍晚,我在朋友 S 家聚會,天色已晚。我的朋友 W 正要走路回家,這時他想起了那個劫匪。他享受著那種微小的恐懼感,決定自己需要能夠自衛。「拜託,S,」他說,「你得給我點東西!我不能就這樣赤手空拳回去。」最後,S 翻出了一把錘子。錘子並不是武器。而且用錘子來防範手機被搶本來就不是個好主意。為了避免坐牢和心理創傷,手機被搶是個廉價的代價。
有時我也想要點東西來防禦生存風險。這有點像你在表演時不知道手該往哪放。也有點像 W 說的「你得給我點東西!」。當我面對終結時,我怎麼能手無寸鐵?所以我環顧四周,尋找可以雙手抓取的東西,好讓我覺得自己正在為這一切做點什麼。
我想很多人都有類似的感覺。這創造了一個販賣火繩槍、槓桿和乾草叉的好市場,只要它們貼上「生存風險」的標籤。在我的腦海中,我時常將這種主題化看作是一層天藍色的油漆,有人遞給我一堆延伸到雲端、看不見盡頭的槓桿和管道。別人在我旁邊操作著手柄,他們也關心生存風險。這看起來很有希望。「操作這些吧,」他們說,「這是讓事情變好計劃的一部分。」
很長一段時間,我都很羨慕那些對如何應對生存風險有宏大願景的人。我不覺得他們的願景有多好。但至少他們有願景!「總有一天,」我想,「我會加入他們的行列。我會進入那個『參考類別』(The Reference Class)。」在我的想像中,我會有一個好的願景,不像其他人那樣。我當時沒想到,願景很糟糕正是那個「參考類別」的定義特徵。
做一些與生存風險相關的事情,感覺確實比住在農場裡、知道生存風險、關心它、卻知道自己無能為力要好。
相關文章
其他收藏 · 0