為何會有動機性推理?

為何會有動機性推理?

Lesswrong·

我認為動機性推理主要並非為了社交談判而演化出的適應性工具,而是一個認知缺陷,之所以存在是因為人類演化遠未達到適應性的最佳狀態。

有一種標準說法大致是:「人類之所以存在動機性推理(motivated reasoning),是因為這在與他人談判時具有/曾具有適應性。」我不認為這種說法經得起推敲;當我想到日常生活中標準的動機性推理案例時,那種模式聽起來像是其中「一部分」的誘因,但遠非「全部」。

案例

假設現在是晚上 10 點,我整個晚上都在玩《文明帝國》(Civ)。我知道我現在「差不多」該準備睡覺了。但是……你知道的,這一回合並不是一個很自然的結束點。而且晚半小時睡覺也沒那麼糟,對吧?諸如此類。這是明顯的動機性推理。但老兄,這種動機性推理看起來並不是非常「社交導向」吧?當然,你可以編造一個故事,說我是在向想像中的觀眾證明自己的合理性之類的,但感覺沒人能僅憑「人類存在動機性推理是因為它對人際談判具有適應性」這個模型,就預測出《文明帝國》這個例子。

另一類例子:在社交場合中,最能得分的舉動往往是承認錯誤並道歉。然而,人們卻本能地編造故事來解釋自己其實沒做錯什麼。即便道歉顯然(如果真的停下來思考的話)會為當事人帶來更好的結果,人們仍會本能地編造那種故事。同樣地,你或許可以編造一些關於演化出次優啟發式(suboptimal heuristics)的故事,但這並不是一個人能從「動機性推理是為了人際談判而演化出來的」模型中提前預測到的行為。

話雖如此,我們也來舉一個讓「動機性推理是為了人際談判而演化」聽起來像是合理誘因的例子。假設我告訴伴侶下午 6:00 下班順路去接她,但到了 6:00 時,我正沉浸在一場有趣的對話中不想停止。對話又持續了幾個小時。我的伴侶對此很不高興。但如果我能透過動機性推理讓自己相信我的選擇是合理的(或者至少沒那麼糟),那麼我就能更容易地說服伴侶這個選擇是合理的——或者至少讓我們在「什麼是合理的」這點上存在合理的歧見,而不是顯得我只是個混蛋。就我個人而言,我希望我的關係比這個例子所暗示的更少一些對抗性,但你可以看出這類事情確實能被該模型預測到。

綜合觀察這些例子(以及許多其他例子),跳入我腦海的主要模式是:動機性推理主要不是為了愚弄他人,而是為了愚弄自己。或者至少是愚弄自己的一部分。事實上,這方面有很多標準的智慧格言:「最容易被愚弄的人就是你自己」等等。是的,在某些例子中,愚弄自己對於與他人談判在工具上是有用的。但人類在許多不涉及他人的情況下(如《文明帝國》的例子),以及自我欺騙在社交上淨值為負的情況下(如道歉的例子),顯然都會進行動機性推理並愚弄自己。整體圖景看起來並不像是「動機性推理的存在是因為它對人際談判具有適應性」。

那麼,為什麼人類會進行動機性推理?

我準備給出一個替代模型。不過首先,我應該指出,即使這個替代模型是錯誤的,上述的批評依然成立。即便我即將勾勒的替代方案也是錯的,「動機性推理的存在是因為它對人際談判具有適應性」基本上仍是錯誤的。

帶著這個前提,模型的第一部分:動機性推理根本不具備適應性。即使在祖先環境中,動機性推理也會降低適應度(fitness)。顯而易見的答案就是正確答案。

什麼?那為什麼動機性推理沒有被演化淘汰掉?

人類遠未達到適應度最佳化,尤其是在認知方面。我們有多項論據和證據支持這一事實。

首先,僅從先驗機率來看:人類大約是認知上能「起飛」的最愚蠢物種,否則我們在祖先歷史中更早、更不聰明的時候就已經起飛了。所以我們不應該期望人類是解決了所有錯誤(bugs)的最佳化心智。

其次,人類的演化速度似乎相對較快,尤其是大腦。我們並非在數千萬年間基本保持不變;我們的演化並未處於平衡狀態,甚至在農業出現之前也不是。

第三,今天的人類顯然存在大量的認知差異,而這些差異(即使在祖先環境中)很可能不是適應度中性的。例如,智商 70 的人與智商 130 的人之間的差異極其明顯,且主要由基因決定,而且在祖先環境中似乎並未涉及其他適應度維度上的同等權衡(例如,智商 130 的人生病頻率並非智商 70 的人的兩倍,消耗的熱量也不是兩倍)。

因此,一般來說,形式為「<人類推理中顯然次優的怪癖>必然具有適應性,因為它沒有被演化淘汰」的論點……其實並沒那麼強。這並非零證據,但只有當該怪癖在演化樹上比人類出現得早得多時,它才具有相關性。

(這確實意味著,如果許多其他哺乳動物也以與人類定性相似的方式進行動機性推理,那將是動機性推理具有適應性的更有力證據。)

好吧,那人類為什麼要進行動機性推理?

即使我們接受人類認知遠未達到適應度最佳化,這也沒告訴我們人類具體有哪些認知錯誤。在指數級龐大的可能認知錯誤空間中,它並未具體預測出動機性推理。它沒有正面預測動機性推理,只是否定了「動機性推理必然在某種程度上是適應度最佳」的論點。

我們上述的論點預測,動機性推理必然是在人類演化史中近期才出現的(否則它會被演化淘汰)。而且動機性推理似乎是人類天生預設的(而不是由特定的文化迷因植入的),所以它必然源於一個或少數幾個基因變化。而這些變化整體上必然增加了適應度,否則它們不會擴散到整個人群。因此,只要我們接受這些前提……動機性推理必然是其他一些整體有益的、近期演化出的認知變化的副作用,儘管動機性推理本身是淨負面的。

我們可以猜測這些變化可能是什麼嗎?

觀察:在動機性推理的例子中,感覺我們的大腦有兩個內部的「計畫評估器」。其中一個是相對短視、由情緒驅動的評估器。另一個則更專注於長期、名聲、他人的反應,以及所有被告知是好是壞的事情;這一個沒那麼近視。動機性推理的基本動態似乎是「短程計畫評估器」試圖欺騙「長程計畫評估器」。

因此,模型的第二部分:長程計畫評估器是人類譜系中近期的認知創新。其他動物有時也會做長程導向的事,但通常不是以通用的方式;通用的長程規劃似乎是人類特有的。而短視的計畫評估器基本上還是在做它一直在做的事:試圖找到可以餵給大腦其餘部分的輸出,以產生短期內感覺良好的東西。在人類身上,這意味著短視的搜尋過程會尋找可以餵給長程規劃器的輸出,以產生短期內感覺良好的東西。因此產生了動機性推理:短視的搜尋過程正在針對長程規劃器進行最佳化,這僅僅是因為短視過程運作的方式與它在整個演化史中的運作方式相同。

例如,當我在晚上 10 點玩《文明帝國》時,我的長程規劃器說「好,現在該睡覺了」,但我的短程規劃器卻說「喔不,那樣現在就沒法感覺良好了,讓我們試著向大腦其餘部分吐出一些其他輸出,看看能不能留住感覺良好的東西」。有時它會撞上像「你知道的,這一回合並不是一個很自然的結束點」或「晚半小時睡覺也沒那麼糟,對吧?」之類的念頭,這些念頭足以安撫長程規劃器,讓我繼續玩《文明帝國》。在理想的心智中,短程和長程規劃器不會像這樣互相對抗;兩者有時都承擔必要的工作。但人類並非理想的心智,長程規劃器(在演化上)是全新的,所有的錯誤都還沒解決。這兩個規劃器只是被塞進同一個腦袋裡,還沒有時間演化出良好的、基因硬編碼的合作協議。

Lesswrong

相關文章

  1. 「對齊很難」的論述為何看似與人類直覺格格不入,反之亦然的六個原因

    5 個月前

  2. 以演化心理學為基礎的價值學習:對CEV的另一種提議

    4 個月前

  3. 探索獎勵推理的玩具環境

    28 天前

  4. 從人格到意圖:邁向 AI 模型動機科學

    9 天前

  5. 反對AI發展的演化論證存在缺陷

    4 個月前