判斷因果關係的簡單法則

Lesswrong·大約 1 個月前

我提出了一個判斷因果推論的簡單啟發式規則：如果所有與 A 相關的事物也都與 B 相關，我們就能適度相信 A 是 B 的因果上游；反之，只要發現任何一個與 A 相關但與 B 獨立的變數，就能推翻 A 導致 B 的假設。這個規則依賴於觀測數據與條件依賴關係，但在巧合或刻意設計的控制系統中可能存在例外。

這裡有一個關於因果推論（causal inference）的簡單啟發式規則：

如果我們發現哪怕只有一個事物 X 與 A 相關^([1])，但與 B 獨立，我們就可以得出結論：A 並非處於 B 的因果上游。
因此，如果所有與 A 相關的事物也與 B 相關，我們就可以適度地相信 A 處於 B 的因果上游。如果我們測量了許多事物，且因果圖可能很複雜（大多數變量都有許多成因和影響），我們的信心可以更高。

例如，考慮「下雨導致我帶傘」這個主張：

應該不可能想到一個與下雨相關、卻不與我帶傘相關的事物。^([2])
反之，應該可以找到與帶傘相關但與下雨無關的事物。例如，我在某天的懶惰程度可能與帶傘呈負相關，即使我的懶惰與下雨無關。

這個規則有一些例外，我將在最後一節討論。

規則的推導

假設 A 和 B 相關（非獨立）。我們想要區分以下三種可能性：

A 導致 B
B 導致 A
兩者互不導致（僅存在共同原因）

現在假設我們想純粹使用觀察數據來區分這些情況。特別地，我們可以針對各種額外變量 X，觀察 {A, B, X} 的聯合分佈。

具體來說，我們將觀察這三個變量之間的條件依賴關係。這包含六個問題：

A 和 B 是否獨立？
B 和 C 是否獨立？
A 和 C 是否獨立？
在給定 C 的條件下，A 和 B 是否獨立？
在給定 A 的條件下，B 和 C 是否獨立？
在給定 B 的條件下，A 和 C 是否獨立？

如果我們要求 A 和 B 相關，且 C 至少與其中之一相關，那麼這組問題最終只有 6 種可能的答案。要麼所有的依賴關係都存在（1 種選項），要麼恰好有一個是獨立的（5 種選項，因為我們已經假設 A 和 B 相關）。^([3])

以下表格顯示了哪些依賴結構與 A 和 B 的三種因果假設相容：

*在 {A, B, C} 之間的條件依賴關係中，沒有任何可能的值可以排除「僅限共同原因」。然而，其他兩個假設中的每一個都可以被單次觀察所證偽。

獲得「A 導致 B」假設的高信心的唯一方法，是努力尋找 C 與 A 相關但與 B 無關的情況。如果 A 不導致 B，我們預期最終會找到這樣的情況，因此沒找到通常是因果關係的強有力證據。

反例總是出現在 C 是以下情況時：

A 的一個與 B 無關的成因
或者是該成因的一個影響

在下一節中，我將通過為每個「允許」的單元格提供因果圖來推導該表格。然後我將討論核心主張的兩個實際例外。

表格的視覺化推導

例外

例外 1：「巧合」與控制系統^([4])

一般來說，因果圖可以告訴你兩個變量何時必須獨立，但它不能排除當因果圖顯示兩個變量不應獨立時，它們卻「因巧合」而獨立。

如果因果關係的內容是從連續的選項空間中隨機選擇的，那麼這種巧合的概率為零。然而，在刻意設計的控制系統中，因果路徑是有可能相互抵消的。

例如，考慮一個恆溫器。恆溫器在時間 $t+1$ 的輸出電壓肯定對房間在時間 $t+1$ 的溫度有因果影響。然而，如果恆溫器運作完美，統計上看起來可能像是輸出電壓並不處於未來室溫的因果上游。讓我們通過因果圖來研究這個例子：

我們的恆溫器因果模型

現在讓我們應用我們的規則。我們想要驗證 A 是否處於 B 的因果上游。既然 X 與 A 相關，它也應該與 B 相關。然而，如果恆溫器運作良好，X 和 B 實際上將是獨立的！時間 $t+1$ 的溫度（「B」）將僅取決於恆溫器的設定點，而不取決於時間 $t$ 的溫度（「X」）——這就是恆溫器運作良好的定義！

圖表顯示 X 到 B 有兩條因果路徑（藍色直接箭頭和經過恆溫器的橘色路徑），但這些路徑會因恆溫器的設計而相互抵消。

對於隨機生成的系統來說，這種設計好的抵消將是概率為零的巧合。

例外 2：除了與 B 的共同原因外，沒有可測量的 A 的成因

這兩個圖表在觀察上是無法區分的：

問題在於 A 除了與 B 共享的成因外，沒有其他成因。

如果我們改用這個圖表，我們就可以通過測量 D 與 A 相關但與 B 獨立，來排除「A 導致 B」。

如果由於某種原因 D 無法測量，我們可以改為測量 D 下游與 B 和 C 無關的變量。但如果出於某種系統性原因，沒有此類變量可供測量，我們的規則將錯誤地得出 A 導致 B 的結論。

感謝 Thomas Kwa 指出控制系統的例外情況，並鼓勵我寫下這篇文章。感謝 Lukas Finnveden 提供有用的反饋。

^(^)在整篇文章中，我將使用「相關」（related）作為「非獨立」（not independent）的準確同義詞，以簡化語言。
^(^)我實際的意思是「非獨立」，但我認為用「相關」（correlated）這個詞會讓句子更容易閱讀。
^(^)我在此假設變量只有在因果圖結構要求它們獨立時才是獨立的。最後一節討論了此假設的例外情況。
^(^)感謝 Thomas Kwa 指出控制系統的例外情況，並鼓勵我寫下這篇文章 :)

https://www.lesswrong.com/posts/KTasQyRBzz6FTB4BL/a-simple-rule-for-causation