無限趨近於假

Lesswrong·

塔斯基的不可定義性定理顯示沒有語言能包含自身的真理概念,這促使哈特里·菲爾德在《拯救真理免於悖論》中探討並最終捨棄了一套基於盧卡西維茨邏輯的真理理論,因為葛瑞格·雷斯托的負面結果顯示該理論在包含量詞時會產生問題。

摘要:^([1])

塔斯基的不可定義性定理表明(在某些合理的假設下),沒有任何語言可以包含其自身的真理概念。這個極其違反直覺的結果開啟了數代人的研究,試圖透過謹慎地捨棄塔斯基的一些假設來繞過該定理。

在哈特里·菲爾德(Hartry Field)的 《從悖論中拯救真理》(Saving Truth from Paradox) 一書中,他考慮並捨棄了一種基於 盧卡西維茨邏輯(Łukasiewicz logic) 的真理理論,稱其為「迄今為止最成功的理論」(在書中當時已考慮的眾多理論中),並列舉了它的許多優點。該理論被捨棄是由於格雷格·雷斯塔爾(Greg Restall)的一個負面結果,該結果表明帶有量詞的該理論版本必然是 ω-不一致的。

我們認為這種放棄過於匆忙。盧卡西維茨邏輯的成功在於假設了真理的「中間值」,從精確位於真與假之間的 1/2 值命題開始,最終延伸到整個實數連續統 [0,1]。為什麼要止步於此?我們提出了一種基於非標準分析的理論變體,透過引入實數之間的真值(例如 1-ϵ),來避免格雷格·雷斯塔爾的悖論。

塔斯基定理

塔斯基研究了*真理謂詞(truth predicates)*的主題。其核心思想是擁有一個 T(‘‘s"),如果 s 是一個真句子,則該謂詞為真,否則為假。(T 是一個作用於數字的函數,而 ‘‘s" 是 s 的哥德爾編碼,即一個編碼了 s 符號字串的數字。)這被形式化為塔斯基 T-模式(Tarski's T-Schema)。對於每個句子 s,我們將此公理添加到形式系統中:

T(‘‘s") ⟺ s

在經典邏輯框架下,塔斯基證明了 T-模式與一個稱為**對角線引理(diagonal lemma)**的技術假設是不相容的。對角線引理指出,對於任何可定義的謂詞 P(.),我們都可以構造一個句子 s,使得以下成立:

s ⟺ P(‘‘s")

也就是說:s 準確地表達了「P 對於 ‘‘s" 為真」。(這個等式與之前的模式不同,因為它適用於任何謂詞 P 而不僅僅是 T,但適用於某些特殊的 s 而非所有句子)。

這種自我指涉的句子聽起來可能是不合法的,但哥德爾在其不完備定理證明中的主要貢獻之一,就是證明了這種情況實際上很難排除:對於大多數感興趣的公理系統,對角線引理都是可以被證明的。

如果對角線引理成立,且定義了一個滿足 T-模式的謂詞 T,那麼可以推導出 ¬T(非真)也是可定義的。這意味著存在一個句子 λ 使得:

λ ⟺ ¬T(‘‘λ")

這個句子被稱為「說謊者句子」。非正式地說,它對自己說:「這個句子不是真的。」

利用 T-模式和經典邏輯,我們可以從 λ 的存在推導出矛盾:如果它是真的,那麼它必然是假的;如果它是假的,那麼它必然是真的。因此,塔斯基將經典的說謊者悖論形式化了。

我們得出了一個矛盾。我們所做的假設是不相容的。我們應該拋棄哪一個?

塔斯基得出結論:T 在該語言中必須是不可定義的。這沒問題:不存在統一的「真理」概念,只有「針對某種語言的真理」。塔斯基定理表明,沒有任何語言可以包含其自身的真理謂詞;相反,語言形成了一個層級結構。要討論一種語言中陳述的真理性,你必須上升到「更高階」的語言。例如,要討論皮亞諾算術(Peano Arithmetic)的真理謂詞,我們可以在策梅洛-弗蘭克爾集合論(Zermelo-Fraenkel set theory)中進行。

並非所有人都對這個解決方案感到滿意。抱怨點在於,這與我們在自然語言中使用「真」的方式不太吻合。至少在直覺上,在英語中,我們可以對任何英語句子詢問「它是真的嗎?」。塔斯基的理論說我們不應該那樣做;我們搞錯了。說謊者悖論的論證確實有效,所以我們需要放棄我們樸素的真理理論。

這引發了一系列試圖拯救樸素真理理論的研究。通常,人們希望透過放棄經典邏輯來保留 T-模式和對角線引理。

我們將重點關注一種被提議的特定邏輯。

盧卡西維茨邏輯

對說謊者悖論的一個常見回應是在語言中增加第三個真值,為了埋下伏筆,我們將其稱為 1/2。說謊者句子 λ 既非真 (1) 也非假 (0),而是獲得中間值 1/2。盧卡西維茨邏輯 Ł 是增加額外真值的多種方法之一。Ł2 是常規的經典邏輯,而 Ł3 具有一個介於真假之間的中間值。

不幸的是,雖然這解決了說謊者悖論,但 Ł3 會受到另一個悖論的影響,在該悖論中,我們構造了一個句子,它聲稱自己既非真也非半真。我們再次陷入沒有一致選項的境地:如果該句子是真或半真,那麼它就是完全假的;但如果它是完全假的,它又是真的。

我們可以添加第四個值(例如 1/4)來嘗試解決這個問題,但同樣可以應用相同的通用策略(構造一個聲稱自己既非真、非半真、也非四分之一真的句子)。通常,這種產生悖論的策略被稱為強化說謊者(Strengthened Liar)。只要 n 是大於 1 的自然數,Łn 都會受到強化說謊者悖論的影響。

幸運的是,我們可以透過在 0 和 1 之間添加無限多個真值來解決所有的強化說謊者問題。

連續值盧卡西維茨邏輯

我將透過把聯結詞定義為實值函數來描述 Ł∞ 的語義。這裡,v(s) 是句子 s 的真值。

真值公式根據前項的定義
⊥ (謬誤)0
a → b (蘊涵)max(0, min(1, 1 - v(a) + v(b))) <br> 即:1 - (v(a) - v(b)) 限制在 [0,1] 區間
¬a (否定)1 - v(a) (即 a → ⊥)
a ∨ b (弱析取)max(v(a), v(b)) (即 (a → b) → b)
a ∧ b (弱合取)min(v(a), v(b)) (即 ¬(¬a ∨ ¬b),德·摩根定律)
a ⊕ b (強析取)min(1, v(a) + v(b)) (即 ¬a → b)
a ⊗ b (強合取)max(0, v(a) + v(b) - 1) (即 ¬(a → ¬b))
a ↔ b1 -
∀x. ϕ[x] (全稱量化)inf_x v(ϕ[x])
∃x. ϕ[x] (存在量化)sup_x v(ϕ[x]) (即 ¬∀x. ¬ϕ[x])

如果你不熟悉,「inf」取一組值的下確界(infimum)小於或等於集合中所有值的最大值。同樣,「sup」取上確界(supremum)大於或等於集合中所有值的最小值。在處理實數時,下確界和上確界保證存在。(這就是為什麼在這裡使用實數而不是有理數是有意義的。)

你會注意到析取和合取已分裂為弱版本和強版本。如果你熟悉線性邏輯(Linear Logic),會發現盧卡西維茨邏輯其實是它的一個特例。如果你想對這類邏輯的用途(除了真理理論之外)有一些直觀了解,我建議閱讀 Michael Schulman 的 《構造數學的仿射邏輯》(Affine Logic for Constructive Mathematics)

盧卡西維茨邏輯也是一種模糊邏輯(fuzzy logic)。事實上,「模糊邏輯」指的就是我們將真值視為 [0,1] 範圍內的實數,並透過上述實值函數定義聯結詞的值。

模糊邏輯通常應用於陳述具有「真理程度」的情況,但其方式不易被解釋為機率。你可能會問:但某事「部分真實」是什麼意思? 一種自然的解釋是模糊陳述,例如「那個盒子很小」。在 Ł∞ 的背景下,請注意 a → b 為 1 當且僅當 v(a) ≤ v(b)。我將其想像為:「噢,如果盒子 A 是小的,那麼盒子 B 肯定也是小的!」。換句話說,真理的標準是模糊的,但是(在盧卡西維茨邏輯適用的地方)這些標準總是可比較的。我們可能無法說一個盒子是否客觀上是小的(給定所有事實),但關於一個盒子是否比另一個盒子更小,這是一個事實。

對於上述所有運算子,我們希望添加一個遵循 T-模式的 T。我們非常簡單地定義它:

v(T(‘‘s")) = v(s)

Ł∞ 是否解決了所有悖論?也就是說:它是否真的與遵循 T-模式的自我指涉真理謂詞相容

我們確實得到以下積極結果:只要我們有有限數量的句子,我們就可以應用 布勞威爾不動點定理(Brouwer's fixed point theorem) 來為這些句子找到一致的真值分配。我將用一些例子來說明這個想法。

這是說謊者悖論:
(此處應有圖表,顯示 v(λ) = 1 - v(λ) 在 1/2 處相交)

以及一個強化說謊者 γ,它可以透過在否定之前「自我相加」(強析取)來定義:
(此處應有圖表,顯示 v(γ) = 1 - min(1, 2v(γ)) 在 1/3 處相交)

無論你如何繪製藍線,只要它是連續的,你就無法避免在某個點與紅色虛線相交。因此,我們總能找到一致的解。類似的觀察也適用於有限的句子集。

然而,事實證明,當涉及無限多個句子時,我們確實會遇到一些麻煩。

雷斯塔爾定理

我們引入盧卡西維茨邏輯是為了能給說謊者句子分配 1/2 的真值,從而避免悖論。事實證明,盧卡西維茨邏輯加上皮亞諾公理可以包含皮亞諾算術而不產生矛盾。也許我們可以為盧卡西維茨邏輯定義一個真理謂詞?

不幸的是,答案是否定的。正如 格雷格·雷斯塔爾(Greg Restall) 在 1994 年所展示的,在盧卡西維茨-皮亞諾算術中加入塔斯基 T-模式的一個版本也會導致悖論。

雷斯塔爾構造了一個無限的句子序列 $a_n$,從定義如下的 $a_0$ 開始:

$a_0 := \neg \forall (n > 0). T(a_n)$

用文字表達:$a_0$ 說存在某個 $a_n$ 是假的,其中 $n > 0$。

對於其餘部分,我們定義 $a_n := a_{n-1} \otimes a_0$。也就是說,句子 $a_n$ 是 $a_0$ 與自身的強合取,總共進行了 $n$ 次。

$a_0$ 的真值是多少?我們將透過矛盾法證明,不存在與此構造一致的數值。

證明: 我們首先將真值 $v$ 的遞歸定義應用於 $a_0$ 的直接公式,得到 $v(a_0) = v[\neg \forall (n > 0). T(a_n)] = 1 - \inf_{n > 0} v(a_n)$。現在,我們分出兩條可能的路徑,並從每條路徑推導出矛盾。

假設 $v(a_0) = 1$。那麼根據強合取的定義,$v(a_n) = \max(0, v(a_{n-1}) + v(a_0) - 1) = \max(0, v(a_{n-1}) + 1 - 1) = v(a_{n-1})$。這意味著所有 $a_n$ 的值都是 $v(a_n) = 1$,這意味著它們的下確界也是 1。結合前一段的語義,我們得到 $v(a_0) = 1 - \inf_{n > 0} v(a_n) = 1 - 1 = 0$,這表明 $a_0$ 必須為假,這與我們開始時的 $v(a_0) = 1$ 不同!

現在假設另一條分支,$v(a_0)$ 不是完全真實的,即對於某個 $\delta > 0$,$v(a_0) = 1 - \delta$。那麼 $v(a_n) = \max(0, v(a_{n-1}) + (1 - \delta) - 1) = \max(0, v(a_{n-1}) - \delta)$。重複應用這一點,我們看到 $v(a_n) = \max(0, 1 - n \cdot \delta)$,因此所有句子的下確界為 0。接下來我們將其代入得到 $v(a_0) = 1 - \inf_{n > 0} v(a_n) = 1 - 0 = 1$。這也與 $v(a_0) = 1 - \delta$ 不同!

顯然,所有分支都導致真值 $v(a_0)$ 與其初始值不同。因此,即使在模糊邏輯的世界裡,也不存在定義良好的真值 $v$:Ł∞-皮亞諾算術加上真理的理論是不一致的。^([2])

但 Ł∞-真理非常美好

哈特里·菲爾德在他的《從悖論中拯救真理》一書中,在對許多不同的自我指涉真理理論進行了廣泛審查後,認為基於盧卡西維茨的理論是所考慮的理論中最成功的:

在某些方面,我們迄今為止考慮的最成功的理論是針對語言的無量詞片段(但允許透過非量化手段進行自我指涉)的盧卡西維茨連續值邏輯。就像克里普克式理論 KFS 在克林邏輯中一樣,但與所有廣義上的經典理論不同,它允許完整的「互換性原則」:True(⟨A⟩) 在任何地方都可以與 A 互換(對於「對...為真」也有類似的原則)。但與 KFS 不同,它有一個合理的條件句;特別是,這使得它能夠包含塔斯基模式的所有實例:

(T) True(⟨A⟩) ↔ A

(以及對於「對...為真」的類似模式)。該邏輯帶有一種令人愉悅的模型論語義,其中包括「→」在內的所有聯結詞都以「值函數」的方式處理——也就是說,句子的賦值僅基於其直接組成部分的值。True(⟨A⟩) 總是獲得與 A 相同的值,這解釋了為什麼這兩個句子是可以互換的。此外,這些值是有序的,當且僅當前件的值小於或等於後件的值時,條件句獲得值 1;這一點加上 |True(⟨A⟩)| = |A| 的事實,解釋了為什麼模式 (T) 的所有實例都成立。我一直在談論「真」,但這一點也延伸到「對...為真」及相關概念。簡而言之,在基於連續值語義的命題邏輯中,關於真、對...為真等的樸素理論將是一個非常好的理論,只要它能推廣到完整的量化語言,而不產生不一致性、ω-不一致性、非保守性(在第 3.3 節使用的保守性意義上),或任何類似令人不快的情況。

哈特里·菲爾德隨後構建了他自己的理論,靈感來自盧卡西維茨邏輯的優點,但遺憾的是複雜得多。我們在本文中的論點是,菲爾德放棄得太早了。當涉及到盧卡西維茨邏輯時,應對悖論的首選策略應該是添加更多的真值!

無窮小真理

具體來說,我們考慮添加一個無窮小值 ϵ,使得雷斯塔爾的悖論句子 $a_0$ 可以獲得值 1-ϵ。這看起來很有希望:也許 ϵ 可以足夠小,使得序列 $v(a_n)$ 永遠不會比 1 小一個正實數,儘管 $v(a_{n+1})$ 總是比 $v(a_n)$ 更小。

最直接的路徑會遇到一些困難。一旦我們添加了無窮小,下確界和上確界就沒有明確定義了。例如,考慮序列 1, 1/2, 1/4, 1/8... 這個序列的下確界是什麼?在實數範圍內,下確界本應是 0,因為它是下界中最大的數。但無窮小 ϵ 大於 0 且小於序列中的所有數字,所以它更有資格。然而,這也不行:2ϵ 甚至更大,且仍然小於所有列出的數字。我們可以一直往上加,永遠不會超過序列中的任何數字,因此不存在下確界。

為了推動解決這個問題,我們將利用*非標準分析(nonstandard analysis)*中的無窮小概念。

非標準分析

牛頓和萊布尼茨最初是用無窮小來制定微積分的。現代微積分教科書則透過建立極限概念來重新表述一切。非標準分析利用模型論復活了無窮小。

實數的標準模型只能用二階邏輯來確定。然而(由於哥德爾的不完備性結果!),二階邏輯沒有完整且一致的推理系統。我們用來推理實數的任何公理系統都等同於一階公理系統(它具有完整的推理系統,但不能唯一地確定實數的標準模型)。

非標準分析利用這一事實將無窮小視為「非標準實數」,它們滿足關於實數的所有一階事實,同時大於零且小於所有正(標準)實數。這產生了超實數(hyperreal numbers)。

非標準分析還利用了稱為*超有限數(hyperfinite numbers)*的非標準自然數。例如,我們不以越來越精細的和的極限這種通常方式來定義積分:

a^b x dx = lim{n→∞} ∑_{i=1}^n (a + i(b-a)/n)

相反,積分被直接定義為一個和:

a^b x dx = ∑{i=1}^N (a + i(b-a)/N)

這裡,N 是一個超有限數:一個大於所有標準自然數,但遵循自然數所有一階性質的非標準數。

這為我們的量詞處理方法提供了靈感。

超有限量化

正如我們之前論證的,如果要使用超實數,我們就不能保留將量化定義為 inf 和 sup 的做法,因為這些操作對超實數來說沒有明確定義。

因此,我們需要將 ∀ 和 ∃ 重新定義為在超限數量 ω 的句子上的最小值最大值。與之前相比,這並不是很大的限制:ω 大於所有自然數,所以我們可以有無窮多個句子 N,只是不能有(標準意義上的)無限多個。

對於超限數量 ω 的句子 $a_n$,之前的證明嘗試不再以矛盾告終。$a_0$ 的真值過去是 $v(a_0) = 1 - \inf_{n > 0} v(a_n)$,但在新的 ∀ 定義下,它是 $v(a_0) = 1 - \min_{0 < n ≤ ω} v(a_n)$。

現在考慮證明的第二個分支,我們猜測對於某個 $\epsilon > 0$,$v(a_0) = 1 - \epsilon$,讓我們取一個無窮小 $\epsilon$。回想一下 $v(a_n) = 1 - n \cdot \epsilon$,因此 $a_n$ 的最小真值是在 $v(a_ω) = 1 - ω \cdot \epsilon$ 時獲得的。將其代入 $a_0$ 的值,我們得到 $v(a_0) = 1 - \epsilon = 1 - (1 - ω \cdot \epsilon)$。解出 $\epsilon$ 得到無窮小 $\epsilon = 1/(ω + 1)$。因此,$a_0$ 的真值與 1 無窮接近,但又與 1 不同!

討論:真理真的在理論「內部」嗎?

我們已經證明,先前證明真理謂詞與皮亞諾算術不一致的方法,在非標準值的盧卡西維茨邏輯中行不通。表面上看,我們似乎提供了一個可以包含真理謂詞而不產生矛盾的理論範例!

這很可能確實如此。但也可能的情況是,我們只是提供了一套有序的無限 Ł-PA 理論集的配方,其中每一個理論都只能表達比自己小的理論的真理謂詞,而不能表達自身的。

這不是一個證明或嚴密的論證,我們只是在指出問題所在。問題在於,在這個新理論中,量詞僅針對超限數量 ω 的元素。這會將理論中的實體數量(即數字的數量)限制在最多 ω 個。或者,可能證明最多存在 ω-1 個數字,在這種情況下,理論會縮減

考慮皮亞諾算術中對於定義加法至關重要的兩個公理,摘自雷斯塔爾的論文

  • ∀x. (x + 0 = x)(數字零是加法的單位元)
  • ∀x. ∀y. (x + Sy = S(x + y))(根據數字的後繼定義加法)

因為我們剛剛將 ∀ 陳述限制在超限數量的元素上(例如最多 ω 個),這意味著加法最多只能在總共 ω 個數字上定義。因此,由此產生的理論與皮亞諾算術不同,它的數字更少。在皮亞諾算術中,可以有無限多條「非標準數」的數線,它們都大於從 0 開始的標準數;但現在最多只能有 ω 個,因為定義數字的「對於所有」陳述最多只能針對 ω 個元素。

即使這是真的,該理論仍然可以表達其「對於所有」陳述中可以包含的元素數量。然而,有可能關於數字如何推導出的某些特性,使得最多只有 ω-1 個(或更少)數字。在這種情況下,用來表達量詞內部實體最大數量的那個數字,在理論本身中甚至不存在,這真是諷刺。

  • ^(^)為什麼要關心真理的形式理論?
    這篇文章主要是為了好玩,但我(Abram)確實看到了 AI 安全方面的潛在應用。AI 安全的一個子問題是可解釋性(interpretability):弄清楚 AI 在想什麼。為了徹底解決這個問題,可能有必要採用一種意義/語義/指涉理論:我們如何一般性地推理某事是「關於」什麼的?
    令人擔憂的是,試圖制定一套足以支撐可解釋性研究的強健語義理論,可能會直接撞上塔斯基的不可定義性定理,該定理表明(在某些假設下)任何語義理論 S 都不可能適用於 S 本身。直觀地說,這暗示人類只有在 AI(在語義意義上)能力弱於人類時,才能解釋 AI 在想什麼。
    塔斯基的不可定義性定理引發了大量關於試圖繞過該定理的文獻,這正是我們在這裡所參與的。這類成功的理論可能與適用於與人類能力相當的 AI 系統的可解釋性理論相關。(我們並不聲稱目前的提議一定是此類應用的正確選擇,儘管我們確實認為它有一些不錯的特性。)

  • ^(^)雷斯塔爾的論文證明了 ω-不一致性,這是一個較弱的缺陷。然而,ω-不一致性與我們給出的基於下確界和上確界的量詞語義相矛盾。因此,我們可以準確地說,我們所做的假設是不一致的。

  • ^(^)這些理論通常是在算術領域內發展的,這意味著為了討論句子,我們需要選擇一種將句子編碼為數字的方法。這在計算機科學中現在是標準做法(在那裡一切都被編碼為二進制數),但哥德爾在此背景下引入了這個想法,所以我們稱這種做法為哥德爾編碼(Gödel encoding)。為了方便起見,本文使用常規引號來表示這一點。因此,這裡的 ‘‘s" 代表句子 s 的哥德爾代碼。

  • ^(^)儘管存在可以證明自身一致性的稍弱系統:自我驗證理論(self-verifying theories)。這些系統可能仍然擁有許多我們熟知並喜愛的定理。

Lesswrong

相關文章

  1. 運用模糊邏輯從說謊者悖論中挽救數學的真理

    5 個月前

  2. 後人類論證

    3 個月前

  3. 比較 Payor 與 Löb

    6 個月前

  4. 數論的非理性深度

    4 個月前

  5. 標記化的黑暗藝術,或:我如何學會開始憂慮並擁抱大型語言模型的未解碼輸出

    6 個月前

其他收藏 · 0