判斷因果關係的簡單法則
我提出了一個判斷因果推論的簡單啟發式規則:如果所有與 A 相關的事物也都與 B 相關,我們就能適度相信 A 是 B 的因果上游;反之,只要發現任何一個與 A 相關但與 B 獨立的變數,就能推翻 A 導致 B 的假設。這個規則依賴於觀測數據與條件依賴關係,但在巧合或刻意設計的控制系統中可能存在例外。
這裡有一個關於因果推論(causal inference)的簡單啟發式規則:
- 如果我們發現哪怕只有一個事物 X 與 A 相關^([1]),但與 B 獨立,我們就可以得出結論:A 並非處於 B 的因果上游。
- 因此,如果所有與 A 相關的事物也與 B 相關,我們就可以適度地相信 A 處於 B 的因果上游。如果我們測量了許多事物,且因果圖可能很複雜(大多數變量都有許多成因和影響),我們的信心可以更高。
例如,考慮「下雨導致我帶傘」這個主張:
- 應該不可能想到一個與下雨相關、卻不與我帶傘相關的事物。^([2])
- 反之,應該可以找到與帶傘相關但與下雨無關的事物。例如,我在某天的懶惰程度可能與帶傘呈負相關,即使我的懶惰與下雨無關。
這個規則有一些例外,我將在最後一節討論。
規則的推導
假設 A 和 B 相關(非獨立)。我們想要區分以下三種可能性:
- A 導致 B
- B 導致 A
- 兩者互不導致(僅存在共同原因)
現在假設我們想純粹使用觀察數據來區分這些情況。特別地,我們可以針對各種額外變量 X,觀察 {A, B, X} 的聯合分佈。
具體來說,我們將觀察這三個變量之間的條件依賴關係。這包含六個問題:
- A 和 B 是否獨立?
- B 和 C 是否獨立?
- A 和 C 是否獨立?
- 在給定 C 的條件下,A 和 B 是否獨立?
- 在給定 A 的條件下,B 和 C 是否獨立?
- 在給定 B 的條件下,A 和 C 是否獨立?
如果我們要求 A 和 B 相關,且 C 至少與其中之一相關,那麼這組問題最終只有 6 種可能的答案。要麼所有的依賴關係都存在(1 種選項),要麼恰好有一個是獨立的(5 種選項,因為我們已經假設 A 和 B 相關)。^([3])
以下表格顯示了哪些依賴結構與 A 和 B 的三種因果假設相容:
*在 {A, B, C} 之間的條件依賴關係中,沒有任何可能的值可以排除「僅限共同原因」。然而,其他兩個假設中的每一個都可以被單次觀察所證偽。
獲得「A 導致 B」假設的高信心的唯一方法,是努力尋找 C 與 A 相關但與 B 無關的情況。如果 A 不導致 B,我們預期最終會找到這樣的情況,因此沒找到通常是因果關係的強有力證據。
反例總是出現在 C 是以下情況時:
- A 的一個與 B 無關的成因
- 或者是該成因的一個影響
在下一節中,我將通過為每個「允許」的單元格提供因果圖來推導該表格。然後我將討論核心主張的兩個實際例外。
表格的視覺化推導
例外
例外 1:「巧合」與控制系統^([4])
一般來說,因果圖可以告訴你兩個變量何時必須獨立,但它不能排除當因果圖顯示兩個變量不應獨立時,它們卻「因巧合」而獨立。
如果因果關係的內容是從連續的選項空間中隨機選擇的,那麼這種巧合的概率為零。然而,在刻意設計的控制系統中,因果路徑是有可能相互抵消的。
例如,考慮一個恆溫器。恆溫器在時間 $t+1$ 的輸出電壓肯定對房間在時間 $t+1$ 的溫度有因果影響。然而,如果恆溫器運作完美,統計上看起來可能像是輸出電壓並不處於未來室溫的因果上游。讓我們通過因果圖來研究這個例子:
我們的恆溫器因果模型
現在讓我們應用我們的規則。我們想要驗證 A 是否處於 B 的因果上游。既然 X 與 A 相關,它也應該與 B 相關。然而,如果恆溫器運作良好,X 和 B 實際上將是獨立的!時間 $t+1$ 的溫度(「B」)將僅取決於恆溫器的設定點,而不取決於時間 $t$ 的溫度(「X」)——這就是恆溫器運作良好的定義!
圖表顯示 X 到 B 有兩條因果路徑(藍色直接箭頭和經過恆溫器的橘色路徑),但這些路徑會因恆溫器的設計而相互抵消。
對於隨機生成的系統來說,這種設計好的抵消將是概率為零的巧合。
例外 2:除了與 B 的共同原因外,沒有可測量的 A 的成因
這兩個圖表在觀察上是無法區分的:
問題在於 A 除了與 B 共享的成因外,沒有其他成因。
如果我們改用這個圖表,我們就可以通過測量 D 與 A 相關但與 B 獨立,來排除「A 導致 B」。
如果由於某種原因 D 無法測量,我們可以改為測量 D 下游與 B 和 C 無關的變量。但如果出於某種系統性原因,沒有此類變量可供測量,我們的規則將錯誤地得出 A 導致 B 的結論。
感謝 Thomas Kwa 指出控制系統的例外情況,並鼓勵我寫下這篇文章。感謝 Lukas Finnveden 提供有用的反饋。