預測被嚴重高估,我們應該停止資助它
有效利他主義和理性主義者迷戀預測與預測市場,並將其納入文化中,但這並未證明非常有用,卻持續獲得大量資助。我們應該切斷這項資助。
摘要
有效利他主義(EA)和理性主義者迷戀上了預測(forecasting)和預測市場,並將其納入文化的一部分,但這並未被證明非常有用,卻仍持續獲得大量的 EA 資助。我們應該停止資助。
我的預測經驗
有一段時間,我是 Manifold 上排名第一的預測者。這種狀態持續了大約一年,直到我兩年多前停止預測為止。即便退出了,直到今天我仍在該平台排名第 8。此外,我在真錢預測市場(Polymarket)上也表現出色,賺取了五位數(美金)的利潤,並贏得了一些 AI 賭局。我提到這些是想說明,如果預測被視為有用,我本可以從中獲得聲望;但相反地,我認為 EA 社群應該停止資助它。
這些年來,我寫過幾篇評論,認為預測不值得資助。你可以在這裡和這裡看到。終於,我抽空寫成了這篇完整的文章。
尋找問題的解決方案
在談論預測時,人們常問:「我們如何利用預測來做出更好的決策?」這是解決問題的錯誤方式。解決問題應該從問題本身開始,然後再看哪些工具對解決問題有用。
人們談論預測的方式與談論加密貨幣/區塊鏈非常相似。人們擁有一種想要使用的工具(無論是加密貨幣還是預測),然後試圖用它來解決問題,因為他們深信這個解決方案。但我認為這是誤導。你必須從你試圖解決的問題開始,而不是從你想要應用的解決方案開始。基於預測具有工具性價值的假設,人們投入了大量工作來建立預測體系、開發平台、舉辦比賽等,但在沒有具體成果的情況下繼續這樣做是相當危險的。
我們資助了足夠多的預測,理應看到實質成果
預測/預測市場並非處於起步階段。大量資金已經投入其中。在 EA 方面,投入金額接近 1 億美元。如果我在本文後續內容中說服你預測並未產生任何豐碩成果,那麼應該注意到,這並非因為缺乏嘗試或投入。
預測研究中心(Forecasting Research Institute)獲得了數千萬美元的資助。Metaculus 每年繼續獲得數百萬美元,用於維護預測平台並進行預測比賽。Good Judgment Project 和 Swift Centre 獲得了數百萬美元,用於進行預測研究、研究並教導他人如何預測。Sage 獲得了數百萬美元來開發預測工具。許多其他機構(如 Manifold)也從 EA 社群獲得了數百萬美元的資助或高估值投資,將資金從其他 EA 志業中轉移出來。我們甚至資助了開發工具的組織,甚至是專為預測設計的程式語言(如 Squiggle)。
在營利性領域,資金規模更大。Kalshi 和 Polymarket 各自籌集了數十億美元,其他預測平台也籌集了數千萬美元。
預測市場也已經起飛。Kalshi 和 Polymarket 的月交易量都顯示出歷史新高或持續增長。兩者的月交易量都在數百億美元左右。預測市場的總年交易量約為 5000 億美元,但它就是沒什麼用。我們能知道每一場籃球賽球員表現的賠率,或者比特幣在未來 5 分鐘內會漲還是跌。雖然有些人認為這些瑣碎的市場有助於磨練技能或識別優秀的預測者,但我認為沒有任何證據支持這一點,這更多是痴人說夢。
如果預測真的運作良好且非常有用,你會看到大部分資金不是花在預測平台上,而是直接花在預測團隊上,或是補貼重要問題的市場。我們幾乎沒看到這種情況,相反地,資金流向了平台、工具之類的東西。我們已經有了一些預測平台,市場本身就會資助它們,但我們卻還在不斷創造新的平台。
EA/理性主義社群在預測上也花費了驚人的(浪費的)時間。許多人全職從事預測或相關工作,但或許更龐大的是在 Manifold 等平台上進行預測的兼職時數。我估計這項活動已經投入了數千人年(person-years)。
以擊球率為導向的捐贈意味著停止那些沒有回報的投注
你可能會傾向於以「擊球率為導向的捐贈」(hits-based giving)為由來為預測辯護。也就是說,嘗試對預測進行幾筆資助是有道理的,因為潛在回報可能巨大。但如果這是基於擊球率的捐贈,那就意味著我們應該尋求巨大的回報,如果沒有回報,我們就必須停止資助。
我想提出我對於「為什麼預測每年仍能獲得數千萬美元資助」的主導理論。那就是:它已成為 EA/理性主義文化的一種特徵。就像 EA 傾向於住在集體宿舍或實行多重伴侶關係一樣,在預測市場上進行預測已成為文化的一部分,與影響力(impact)關係不大。這與我們為了影響力/價值觀一致而做的 EA 文化部分不同(例如吃素、捐出 10% 以上的收入、在論壇寫作或參加會議)。我認為預測屬於前者。
到了這個階段,如果預測真的有用,你應該會看到實質性的結果。我可以向你指出成千上萬隻不再被關在籠子裡的蛋雞,我可以向你指出明顯不再生活在貧困中的家庭。我可以向你展示已經通過或即將通過的 AI 立法。我可以向你展示 AMF 的成功:挽救了約 20 萬人的生命,大幅降低了瘧疾發病率,更不用說提高了收入和預期壽命,讓原本會死去的人活得更久。我可以從個人層面展示,更重要的是,我可以從廣泛的統計層面展示。我不認為在「因為發生了這次預測,所以我們現在針對所關心的終極目標做出了明顯更好的決策」這方面有太多證據。儘管沒有實質結果,人們仍夢想著預測能為更好的決策提供資訊或帶來更好的政策。我只是沒看到這發生的任何證明。
感覺有用,實則不然
預測是一個非常陰險的陷阱,因為它讓你覺得自己在產出,實則不然。我喜歡玩雙人象棋(bughouse)和一堆不同的桌遊。但當我玩這些遊戲時,我不會聲稱我是為了影響力或基於有效利他主義的理由而玩。如果我花時間學習這些桌遊的策略,我不會假裝這能讓世界變得更好。預測是一項危險的活動,特別是因為它是一項有趣的、遊戲般的活動,幾乎是完美地為 EA/理性主義者設計的,因為你可以證明自己在別人錯誤時是對的、為自己的信念下注,並參與文化實踐。這簡直是為這些群體量身打造的消磨時間工具,因為它提供了一種「你正在改善世界的認識論(epistemics)」的幻覺,而實際上,它主要只是一個遊戲,而且很好玩。你感覺自己在改善世界的認識論,因此一定會有一些溢出效應,進而讓你覺得花時間把某個 AI 預測問題、或者某個關於「交易市場人數是奇數還是偶數」、「某人年底前是否會交到女朋友」的問題從 57% 修正到 53% 是有道理的。
結論
許多人仍然喜歡預測這個點子。如果它變成 EA 社群中一個可選的、良性的活動,那麼它可以繼續存在,但不應繼續成為慈善資金的主要目標。我們始終處於資源分配的優先順序篩選中,而預測顯然不合格。我擔心我們會繼續將社群資源傾注到預測中,並繼續將其模糊地視為改善或提供決策資訊,但我對此深表懷疑。
相關文章
其他收藏 · 0