將暫存器與自身進行 XOR 運算是將其歸零的慣例，但為什麼不用 sub 指令？

Hacker News·大約 5 小時前

這篇文章探討了為什麼 x86 編譯器偏好使用 XOR 而非 SUB 來將暫存器歸零，並指出雖然兩者都很高效且能被現代 CPU 識別，但 XOR 透過開發者與編譯器偏好的滾雪球效應，最終成為了業界標準。

20260421 00

背景

在 x86 組合語言中，將暫存器歸零的標準做法是使用 xor eax, eax，而非直觀的 mov eax, 0。微軟資深工程師 Raymond Chen 近期探討了為何開發者普遍偏好 XOR 而非同樣能達成歸零效果且指令長度相同的 sub eax, eax。雖然兩者在現代處理器中都受到特殊優化，但 XOR 顯然已成為程式設計師與編譯器之間不成文的文化共識。

社群觀點

針對為何 XOR 最終勝過 SUB，Hacker News 的討論呈現出技術演進與社會慣例交織的有趣視角。部分技術派網友認為，從硬體底層邏輯來看，XOR 運算在理論上比減法更簡單。減法運算需要處理位元間的進位傳遞，即使現代處理器採用超前進位加法器將延遲縮減至對數級別，其電路複雜度仍高於位元獨立運算的 XOR。雖然在 8086 時代兩者的執行週期已經相同，但這種「邏輯運算比算術運算更輕量」的直覺，可能影響了早期程式設計師的選擇。

然而，更多討論指向了社會慣例與路徑依賴。有觀點認為，這是一種典型的「群聚效應」。當早期編譯器作者或頂尖高手出於某種微小的偏好（例如覺得 XOR 看起來更聰明）而選擇了它，後進者便會因為信任前人的專業而紛紛效仿，最終形成強大的慣性。這種慣性甚至反過來影響了硬體設計，Intel 與 AMD 為了迎合主流代碼，特別在解碼前端針對 XOR 歸零進行優化，使其在暫存器重命名階段就能直接處理，而不必佔用實際的執行單元。這種硬體層級的「零週期執行」優化，進一步鞏固了 XOR 的統治地位。

有趣的是，討論中也提到了不同架構間的差異。例如在 Itanium 架構中，XOR 歸零無法重置 NaT 位元，因此必須使用專門的零暫存器；而在 RISC-V 或 MIPS 等架構中，由於硬體直接提供了常數零暫存器，開發者根本不需要這些歸零技巧。此外，也有網友提出一些另類的觀點，例如利用 XOR 與 SUB 的微小差異來進行隱寫術，透過在編譯時交替使用這兩種指令，可以在不影響程式功能的情況下，在機器碼中隱藏特定資訊。

總結來說，社群共識傾向於認為 XOR 的勝出並非基於顯著的效能優勢，而是一種歷史偶然。一旦某種做法獲得了微弱的領先，它就會像滾雪球般成為標準。儘管 SUB 在處理旗標位元（Flags）時可能更為乾淨，但在一個已經被 XOR 統治的生態系中，這種細微的技術優點已不足以扭轉長久以來的開發習慣。

你的個人知識庫

將暫存器與自身進行 XOR 運算是將其歸零的慣例，但為什麼不用 sub 指令？

背景

社群觀點

延伸閱讀