深度解析德瓦凱什·帕特爾對輝達執行長黃仁勳的播客訪談

深度解析德瓦凱什·帕特爾對輝達執行長黃仁勳的播客訪談

Lesswrong·

AI 生成摘要

這篇文章分析了與黃仁勳的訪談,內容涵蓋輝達的商業策略、晶片分配,以及一場關於對中國出口人工智慧晶片限制的激烈辯論。

有些播客本身就具備「沒錯,我一定要好好拆解這集」的推薦等級。這一集就是其中之一。所以,我們開始吧。

如同以往的播客文章,基礎的列點描述了所提出的關鍵點,而縮排的陳述則是我的評論。部分內容已被省略。

如果我直接引用,我會使用引號,否則請視為轉述

就像我之前報導過的上一場播客——Dwarkesh Patel 對 Elon Musk 的 2026 年訪談一樣,我們面對的是一位無疑在為自己的議程和利益說話的執行長,且已被證明是一位不可靠的敘述者。因此,我們必須考量有限不信任(bounded distrust)的相關規則。

Elon Musk 是一個特殊案例,他在某些方面充滿了技術洞察力和獨特且有價值的見解,但在其他方面,他只是在說一些不實之詞,且通常是他明知不實的話,做出市場定價基本上為 0% 的預測,並提供荒謬的數字和時間表。

黃仁勳(Jensen Huang)並非如此,過去他一直遵循較傳統的有限不信任規則。他會提出有利於己的「顯然胡扯」的論點,並使用激進的框架,但不會做出可證明的虛假事實陳述或荒謬的預測。我認為他在這次訪談中大多堅持了這一點,但仍有一些大話似乎至少是在邊緣試探。

我不為黃仁勳擔心,我只擔心他。

完全公開:我是輝達(Nvidia)的直接股東。我持有長線。

[排程說明:每週 AI 貼文將於明天 4/17 發布,其「知識截止點」為 Opus 4.7 發布之時。對 Opus 4.7 的報導將於週一開始。]

播客概覽第一部分:平凡的商業訪談

這基本上是一場分為兩個部分的訪談。

前半部分直到大約 57 分鐘處,我還會包括結尾最後的幾個問題,都是關於平凡的商業問題。為什麼以及輝達如何做出這些選擇、這些投資、這些晶片的分配?輝達的護城河在哪裡?他們如何思考這些問題?

在這些問題中,毫無疑問黃仁勳是在為自己的利益說話,談論輝達有多麼偉大。這是執行長會做的事,或許說得有點過頭,但除了對所謂的「末日論者(doomers)」隨意攻擊了一番之外,這還算公平競爭。

黃仁勳貶低 TPU,認為其靈活性不如 GPU,包括缺乏 CUDA,並表示這對不同的 AI 架構也會產生影響。我不相信這點優勢對大部分業務有那麼大的影響。

他對輝達如何分配晶片的解釋似乎缺乏誠意,我核心上並不相信他的說法,但這類事情通常就是這樣。

前半部分最有趣的地方是他對 Anthropic 的評論,特別是 Anthropic 最終為何主要在 Tritium 和 TPU 上進行訓練和運行。

黃仁勳對 Anthropic 讚譽有加,他為讓這個機會從指縫中溜走承擔了責任,並誓言不會讓這種情況再次發生。他原以為 Anthropic 會獲得普通的風投融資,因為他不了解他們的算力需求程度。因此,在早期,Google 和 Amazon 進行了投資,並將 Anthropic 鎖定在那些替代晶片生態系統中。他後來很樂意投資,但 Anthropic 已經投入了大量工作來整合和使用其他晶片。

黃仁勳錯失 Anthropic 的部分原因在於當時他缺乏自由現金,但主要是因為他對「規模化(scaling pilled)」和「AGI(AGI pilled)」的認知不足。他現在明白了,但他還沒有更新得足夠徹底。對於即將到來的一切,他在任何意義上仍然不夠「入戲」。他聲稱只要提前幾年通知,他就可以隨心所欲地擴展整個供應鏈,但卻一直沒有進行充分的擴展。幾年內,電力將成為晶片銷售的新潛在限制因素,但在這之前,這並非重要的事實。

在前半部分中,沒有任何跡象表明他認為自己經營的是除了規模獨特巨大、快速且盈利之外的普通電腦硬體業務。

播客概覽第二部分:關於晶片出口的辯論

每個人都在討論的訪談後半部分,他們針對向中國出口 AI 晶片的問題進行了辯論,有時甚至相當激烈。黃仁勳當然想把晶片賣給中國,而 Dwarkesh 則主張我們不應該這樣做,同時將其呈現為一種「魔鬼代言人」的立場。我的解讀是,他大多相信自己所辯論的內容,儘管帶有一些不確定性。

這是一場難度極高的訪談。Dwarkesh 在參與和不畏縮地反擊方面做得非常好。其中一部分內容有時會陷入循環,但這似乎是不可避免的,而且往往以其特有的方式揭示了一些東西。為他的堅持點讚。

黃仁勳試圖在許多事情上兩頭討好。他的晶片好得多,但中國擁有其所需的所有晶片製造能力;但中國擁有無限的能源,潛在的數據中心電力充足卻空置;但他們可以只使用更多較差的晶片;但美國領先太多,我們不應該擔心少量的晶片銷售;但如果我們不賣那些晶片,我們就放棄了全球第二大市場;而且你既可以也無法切換模型架構;我們的銷售既不會影響中國的算力獲取,又是他們是否留在 CUDA 上的關鍵區別,諸如此類。

最重要的一點是,他反覆明確表達了他所關心的事物。

重要的是輝達向中國出售晶片。就這樣。其他都不重要。這能保持輝達和 CUDA 的主導地位,而對輝達有利的就是對美國有利的,因為如果任何東西是建立在他的晶片之上,那就是「好消息」且我們贏了;而如果是建立在別人的晶片之上,那就是「壞消息」且我們輸了。

這實際上完全說不通。誰的晶片在運行模型和應用程式並不是最重要的事情,這應該很容易看出來。而且,晶片銷售領域並沒有真正的競爭,很長一段時間內也不會有,因為每個人的算力都受限,且中國生產即使是差得多的晶片的產能也受到嚴重限制。

根據黃仁勳的論點,我們正在犧牲他那層 AI「五層蛋糕」來造福模型層,這是不公平的,且對美國不利,因為這意味著我們的「技術棧(tech stack)」不會贏,而重要的是這個神秘的「棧」,它實際上是晶片本身的代稱。

即使 AI 將無限期地保持為「普通技術」和「純粹工具」,且我們處理的只是平凡的 AI,這在輝達能夠飽和市場需求之前至少都是錯誤的。賣給中國的每一顆晶片,都是一顆沒有製造並賣給美國的晶片。即便在那之後,算力獲取也將是經濟生產力、技術進步以及國家安全的關鍵,即使在這些平凡的世界中也是如此。

如果你明白超級智能(superintelligence)很可能即將到來,且一切都將改變,而且很可能在相對較短的時間內發生,那麼情況就會變得令人難以承受。

黃仁勳對於網絡安全和 Mythos 問題的回答尤其糟糕,他的回答是我們需要與中國人對話,讓他們同意不將 AI 用於不良目的,大概也包括網絡攻擊。

我非常支持與中國就 AI 安全問題進行對話,並就不要做的事情達成共識,但在這種情況下,這顯然是無望的天真且在物理上不可行。中國人在達成協議後又公然違反協議有著悠久的歷史,那麼一旦我們允許他們擁有這種能力,驗證方法是什麼?

你會要求他們嚴格限制並監控所有的 API 調用嗎?因為即使可以信任他們想要停止這樣做,這也只是最低限度的要求。實際上,從一開始就不開發這些能力要容易得多,但無論如何,你都需要先奠定基礎,這需要時間,而我們還沒有這樣做。

因此,是的,這裡存在巨大的分歧,黃仁勳在 AGI 和超級智能的概念上仍然處於合法的「未入戲」狀態,他不了解他的公司正在促成什麼樣的存在。

而且,即使黃仁勳在這一點上是對的,考慮到我們已經知道的可能性,他在其他方面仍然是錯誤的。我們已經過了「AI 是一種普通技術,你應該直接賣晶片給中國」這種論點還能成立的階段。我們知道這不是真的。

黃仁勳只想要一樣東西,這並不令人厭惡,但我還想要其他的東西。

我將在本文末尾,在有了適當的背景資訊後,再涵蓋各方的反應。

輝達的護城河是什麼?

  • 輝達製造台積電(TSMC)和其他公司用來製造硬體的軟體,但為什麼這不會像其他軟體一樣被商品化?黃仁勳被問過很多次這個問題,他以一段顯然經過排練的演講作為回應。他給出了三個真正的答案:需求會一直上升、軟體公司通常會隨著工具的使用而蓬勃發展,以及輝達的特定任務極其困難。

需求肯定會上升。這點沒有爭議。

  • 軟體公司只有在能夠持續提供優於競爭對手的獨特產品,且特別是在有價值方面優於新進入者和自製產品時,才能隨著工具的使用而蓬勃發展。目前尚不清楚情況會如何發展,而他並未提供論據。

  • 輝達的任務確實極其困難。利用有限的台積電產能來創造稍微更強大的晶片的能力只會變得更有價值,即使競爭對手也能做得不錯。但這並不能解釋為什麼在「輝煌的 AI 未來」中,對手無法設計出同樣好的晶片。

  • 我仍然很高興(非投資建議!)能長線持有輝達,但這還沒有向我們展示出多少護城河。

  • 輝達有約 1000 億美元的採購承諾,很快將達到 2500 億美元,鎖定了稀缺組件。這就是輝達的護城河嗎?黃仁勳說他們做出了巨大的承諾,包括通過展示未來的市場規模來引導其他公司進行大規模投資,他花了很多時間做這件事。他們擁有供應鏈、現金流和周轉率。

我相信這些都是非常有助益的偉大投資,且新的競爭對手會在這些環節中掙扎。

  • 我不認為如果存在嚴重的競爭,這會是一個可持續的長期護城河,但在中期內,這是一個巨大的優勢。

  • 輝達能年復一年地保持收入翻倍和提供的算力(flops)翻三倍嗎?還是我們會遇到像台積電那樣的產能牆?黃仁勳指出任何東西都可能成為瓶頸,最難的實際上是電工和水管工,但他們正在全力擴展一切,所有的瓶頸都會得到關注。只要有需求信號,任何給定的瓶頸都可以在兩三年內擴展。

  • 他想要「讓美國重新工業化」。他需要能源,但其他東西都是 2-3 年就能解決的問題。

  • 「這是我對末日論者描述工作終結和扼殺職位的擔憂之一。如果我們阻礙人們成為軟體工程師,我們將會耗盡軟體工程師。十年前也發生過同樣的預測。一些末日論者告訴人們:『無論你做什麼,都不要當放射科醫生。』你可能還能在網上聽到一些影片說放射科將是第一個消失的職業,世界將不再需要放射科醫生。猜猜我們現在短缺什麼?放射科醫生。」

這顯然是一個將「末日論者(doomer)」當作貶義詞使用的案例,目的是通過聯想和氛圍來駁斥任何擔心 AI 負面影響的人。

  • 這也有一些有效的論點,但邏輯不通。我們必須拆解。

  • 關於「他們搶走了我們的工作」的擔憂有兩種,這裡將其混為一談了。

  • 第一種是整體的「工作終結」和整體的職位扼殺,以及對大規模失業和工資下降的擔憂。他說他起初在應對這種擔憂,但隨後轉移了話題,實際上並沒有談論它。正如我之前說過的,我認為有些人對此過於擔心,但隨著能力足夠強大,這會變成一個巨大的擔憂。

  • 他主要討論的是特定工作將遭受局部技術性失業的預測。

  • 在今天的 AI 領域,這顯然在某些案例中是真實的。如果你十年前告訴某人去當翻譯,那你就是害了他們。

  • 放射科醫生是一個有趣的案例,經常被討論。那些對此發出警告的人是對的,AI 在分析影像方面將超越人類。

  • 但這導致了對放射科需求的增加,且 AI 無法取代該工作的許多其他部分,而且因為從長遠來看放射科將越來越自動化,而醫生的職業生涯長達 40 年,許多人選擇不進入放射科。

  • 所以目前在 2026 年,我們面臨短缺,放射科醫生的收入很高。然而,從長遠來看,放射科醫生的需求佔醫生總需求的比例很可能會下降。標準經濟理論認為,這意味著我們目前應該會出現放射科醫生的短缺。

  • 因此,目前尚不清楚這種短缺是否甚至是不效率的。但就其程度而言,如果我們犯了一個集體錯誤,那就是對這個特定專業做出了具體的錯誤預測,而該專業的培訓有著多年的滯後。

  • 轉向軟體工程師,我們在這裡對這兩種錯誤的擔憂應該較少,因為特別是現在有了代理式編碼(agentic coding),編碼人員的供應是有彈性的。你可以相對快速地入門。我的猜測是,在一段時間內我們需要更多的工程師,而不是更少。

  • 這不應該是「末日論者」或「減速派(decel)」對抗「樂觀主義者」或「加速派(accelerationist)」的問題。這是一個分配問題,你必須具有前瞻性,盡力而為,而誰對大局的看法正確,並不代表誰對具體選擇的看法就正確。

TPU vs. GPU

  • TPU 訓練了 Claude 和 Gemini。這意味著什麼?又是演講時間。黃仁勳將 TPU 定位為窄眾產品,而 GPU 則加速各種計算,因此擁有更廣泛的市場覆蓋。你可以自己做或租用,並做 TPU 做不到的事。

這引出了一個問題:為什麼算力不能更具通用性(fungible)?黃仁勳提到的 xAI 擁有這些巨大的 GPU 陣列,但沒人想要他們的推理服務,那他們為什麼不把那些產能租出去?或者他們已經在租了?

  • 我相信 GPU 有很多 TPU 無法觸及的應用。畢竟,我不會用 TPU 來驅動我的顯示器。

  • 但如果 AI 是未來想要算力的主導原因,且 TPU 在那裡可以與 GPU 互換,那麼 TPU 難道不會最終在大部分領域產生競爭力嗎?

  • 黃仁勳的論點沒有解決這個問題,而這是核心的隱含問題,所以 Dwarkesh 問得更明確。

  • Dwarkesh 指出,輝達每季度 600 億美元的利潤大部分來自 AI,而非量子計算和製藥。既然如此,為什麼還需要 GPU 的靈活性?黃仁勳說,當然是矩陣乘法,但你也可能想使用其他技術。他吹噓 Blackwell 比 Hopper 的能源效率提高了 50 倍。MoE(混合專家模型)就是其中一項創新。

黃仁勳說的是每單位算力或相同軟體任務的效率提高 50 倍,而不是晶片對晶片的比較。電力仍然是一個限制因素。

  • MoE 是 Google 在 TPU 上投資開發的,所以顯然他們可以做 MoE,儘管如果你不是 Google 或 Anthropic,你可能需要 CUDA。

  • 如果 Google 願意開源其內部的 TPU 內核庫,它可以消除大部分或全部這種有效差距,但他們不想那樣做,寧願嘗試使用他們的 TPU 在 AI 領域獲勝,而不是出售晶片。

  • Google 這樣做對嗎?不清楚,但賣給 Anthropic 一大堆晶片是一個奇怪的中間路徑,可能反映了 Cloud 部門和 DeepMind 之間的內鬥。

  • 重點是,輝達在 AI 晶片領域對抗 Google 的護城河……主要是 Google 自己?

  • 輝達 60% 的收入來自五大超大規模雲端服務商(hyperscalers)。他們需要 CUDA 嗎?OpenAI 有 Triton,Anthropic 和 Google 運行自己的加速器。黃仁勳給出了「樂於幫助所有框架」以及「CUDA 非常靈活,擁有巨大的安裝基礎和每個雲端供應商」的談話要點。

好吧,當然,沒什麼令人驚訝的,但很紮實。

  • 然而,這些優勢對重要客戶來說是否足夠重要,足以保護 70% 以上的利潤率?輝達有大量的工程師在優化每個人的技術棧,我們談論的是 2 倍或更多的提升。他嘲諷 TPU 和 Trainium 沒有通過 InferenceMAX 進行衡量,聲稱所謂的 TPU 40% 優勢毫無意義,且可能是假的。

輝達確實有真正的優勢,但黃仁勳在這裡有點言過其實。

  • 黃仁勳說所有這些「競爭」其實就是 Anthropic:「Anthropic 是一個獨特的案例,而不是一種趨勢。沒有 Anthropic,為什麼會有 TPU 的增長?100% 是 Anthropic。沒有 Anthropic,為什麼會有 Trainium 的增長?100% 是 Anthropic。我認為這是眾所周知且被充分理解的。並不是說有大量的 ASIC 機會。只有一個 Anthropic。」而 OpenAI 可能正在構建 Titan,但他們「絕大部分是輝達」。

其主張基本上是「Anthropic 是個怪異的例外,其他 AI 公司絕不會那樣做,那是那些晶片有實質銷售的唯一原因」。

  • Anthropic 是概念驗證,但如果你需要長期的投資和規模,甚至在第一天就需要對 TPU 有深度的熟悉才行得通,那麼或許吧?

  • 黃仁勳基本上將 Anthropic 使用 TPU 歸咎於他當時無法早期投資 Anthropic,而 Google 和 AWS 投資了。他不會再犯那個錯誤。

我不認為這部分是「Amazon 和 Google 賄賂 Anthropic 以獲取他們的業務」,而主要是「輝達未能賄賂 Anthropic」。

  • Dwarkesh 指出,在 70% 的利潤率下,即使你比輝達差很多,如果你自己研發,仍然可以領先。黃仁勳反擊說,像 Broadcom 這種地方的 ASIC 利潤率也差不多,大約 65%。

為什麼輝達不進行超大規模擴展?

  • 黃仁勳說輝達在能擴展的時候就立刻擴展了,並在能投資實驗室的時候就立刻投資了。當時沒有足夠的現金,他以為實驗室會從風投那裡籌資。他很高興 Anthropic 存在,儘管他們是從 Google 和 Amazon 那裡籌資的。

這是交易員的哀嘆。如果這是一筆好交易,你應該做得更多,而且你應該更早做。

  • 但現在有了這麼多錢呢?為什麼不成為雲端供應商?那不是輝達的業務或哲學。如果別人能做,就讓他們去做。

人們低估了保持專注的重要性。

  • 我完全相信輝達在這裡做出了正確的決定,如果你不認為超級智能會讓除了 AI 實驗室之外的所有人都失去權力的話。投資所有的模型公司,鎖定盡可能多的業務,無論誰贏都贏,不要試圖成為模型公司或雲端供應商。

  • 如果你確實認為只有 AI 實驗室才重要,就像馬斯克那樣,那麼這就是個大錯誤。好吧。

  • 為什麼輝達不「挑選贏家」?這不是他們的工作。讓他們去競爭。

我會補充一點,競爭對輝達有利。

  • 輝達當然在另一種意義上「挑選贏家」,通過選擇投資的規模、選擇估值以及選擇分配,它只是試圖以一種保持競爭流動的方式來做這件事。

  • 如果輝達真的不想挑選贏家,它會完全通過價格來分配。

  • 輝達「不想進入融資業務」,但當然,當 OpenAI 需要 300 億美元時,他們會提供幫助,這是一筆偉大的投資。他們不「只是想支撐新興雲端(neoclouds)」或超大規模服務商或實驗室。

他們就在融資業務中。那就是融資業務。

  • 話雖如此,我不認為輝達這樣做是為了支撐原本沒有前途的業務或進行糟糕的投資。我認為輝達利用這一點來確保業務交易,同時也進行原本就很不錯的投資。三贏。

  • 他們處於融資業務的那一端,即你首先必須證明你不需要融資。這就是大部分的融資業務。

  • 雙方都同意:GPU 短缺。

這在稍後會很重要。

  • 輝達如何瓜分稀缺的 GPU 分配?首先客戶必須下採購訂單。然後是先到先得。Larry 和 Elon(被無端提起)從未乞求過 GPU。這都只是下訂單而已。

我沒有任何內部消息,但這聽起來完全是胡說八道。

  • 曾有很長一段時間存在真正巨大的 GPU 短缺,需求是輝達定價下供應量的許多倍。分配是生死攸關的。

  • 如果你真的無所謂,你會漲價。

  • 如果真的是完全先到先得,那麼分配模式看起來會非常不同。

  • 即使黃仁勳不打算聽,Elon Musk 當然會像其他人一樣盡其所能地嘗試鑽系統漏洞,甚至更甚。也許他沒有「乞求」本身,但這是一個經典的「可疑的具體否認(Suspiciously Specific Denial)」。

  • 這與他講述的關於 Anthropic 的故事並不一致。

  • 為什麼不出價高者得?「因為這是糟糕的商業行為。你設定價格,然後人們決定是否購買。我知道晶片行業的其他人在需求較高時會改變價格,但我們就是不會。這從來不是我們的做法。你可以信賴我們。我更喜歡成為可靠的、行業的基石。你不需要猜測。如果我報了價,我們就報了價。就這樣。如果需求暴漲,那就這樣吧。」

每個經濟學家現在都在尖叫。

  • 如果你不能被依賴交付產品,你就不可靠。

  • 如果你在固定的過低價格下純粹先到先得,你通常無法交付。

  • 是的,我同意如果我報了價,即使需求上升,價格也是那個價格。但輝達多年的價格都低於市場出清價。

  • 他們與台積電有著極好的關係。他們會爭吵,有時會有一些「粗糙的正義」,但你可以指望台積電每年都在那裡,輝達每年也帶著新產品在那裡。兩者都可以根據你的需要進行擴展,你只需要下訂單。

如果這不是真的,他還是會說同樣的話。

  • 這是一個奇怪的情況,雙方都需要彼此並必須瓜分利潤,擁有巨大的潛在協議區間(ZOPA),但最終他們確實讓它運作了。

  • 那些巨額資金?它們有幫助。

  • 考慮到爆炸性的增長,在大部分時間裡出現某種程度的短缺是有道理的。與 Anthropic 犯了同樣的「錯誤」。

向中國出售晶片

到目前為止,他們花了一個小時詢問黃仁勳標準的商業問題,而他提供了大多標準的商業回答。沒人在討論那一個小時。

接下來的部分是網上每個人都在討論的部分。出口管制。

  • Dwarkesh 將自己呈現為魔鬼代言人。他將站在反對出口的一方。

  • 關於 Mythos 呢?如果中國公司能夠訓練出像 Mythos 這樣的模型,特別是率先訓練出來,難道不會威脅到美國的國家安全嗎?

我想我們都能同意那將是一個非常可怕的情景,作為一個我們不希望中國擁有最強大模型的具體例子。

  • 出口管制還有其他類別的案例。

  • 黃仁勳首先說 Mythos 是由一家非凡的公司利用「相當平凡的算力、相當平凡的能力」訓練出來的。中國擁有這樣的能力。他「希望美國贏」,但不要把他們變成你的敵人,他們太有能力了,你看。「他們製造了世界上 60% 的主流晶片,甚至更多……他們擁有世界上 50% 的 AI 研究人員。」

Dwarkesh 在這裡提供了關於這一點和接下來幾項內容的精簡回顧

  • 聽著,從功能上講,這完全是胡說八道。

  • 是的,技術上這裡的統計數據可能是真的,但他試圖說「中國擁有其所需的所有晶片」,這是假的;以及「中國擁有和我們一樣多的天才」,這也是假的(研究人員數量是衡量天才和能力的一個非常愚蠢的指標);並且「因此我們無法擊敗中國,我們必須達成協議」。

  • 他並不希望美國贏。或者至少他不太在乎。事實上,他在錯誤地說我們贏不了。

  • 他想要「研究對話」,以就 AI 不應被用於什麼用途達成協議。

我確實希望與中國就 AI 安全問題進行對話。我強烈同意我們的研究人員和 AI 人員進行交流是有益的。

  • 同意擱置 AI 的某些用途是好事。第一步「AI 不得掌控核武器」顯然是好事。

  • 將其擴展到網絡攻擊也會是好事,但在什麼意義上我們不是已經有了不進行網絡攻擊的協議?

  • 又在什麼意義上中國不是一直在公然無視那條規則?

  • 那麼,如果中國擁有了進行網絡攻擊的 AI 能力,我們為什麼會期望他們遵守這樣的協議?你會進行真正的驗證嗎?

  • 達成一項不將 AI 用於 [X] 的協議,比達成一項確保 AI 從一開始就無法做 [X] 的協議要難得多。達成一項廣泛的通用協議實際上可能比達成狹隘的具體協議要容易得多。

  • 黃仁勳談到開源和初創生態系統對網絡安全至關重要,「生態系統需要開源模型」來開展工作,而且很多網絡安全工作都來自中國。他說:「那種認為會有一個 AI 代理在沒人看管的情況下到處亂跑的想法簡直是瘋了。」

現在就有 AI 代理在沒人看管的情況下到處亂跑。

  • 以後還會有更多。接受現實吧。

  • 那瘋狂嗎?或許吧。但它正在發生。

  • 至於其他內容,大多是風馬牛不相及,這不是網絡安全的未來,他肯定沒有在這裡擊碎謠言。

  • Dwarkesh 進行了反擊。中國的晶片頂多是 7 奈米。他們的算力(flops)只有我們的 10%。Anthropic 率先達到那裡並得以開發 Glasswing 是非常重要的。一旦這樣的模型出現,算力的數量就變得非常重要。所有的實驗室都受限於算力,無論是在美國還是在中國。

他在這一切上似乎完全正確。

  • 黃仁勳回應說,是的,我們應該永遠保持領先並永遠擁有「更多」算力,但中國擁有「巨大」數量的算力,是世界第二大市場,他們可以將其整合。

「巨大」在這裡是相對的。

  • 理論上他們可以整合,但出於顯而易見的原因他們不會,而且如果他們真的那樣做了,那會讓整件事變得更加可怕。

  • 黃仁勳一直同時在說「我們在算力上有優勢」以及「但他們有足夠的算力」,還有(在訪談稍後以及平時一直以來)「我們應該放棄很大一部分優勢,以換取我賺更多的錢」。

  • 黃仁勳轉向能源。中國擁有所有的能源。「為什麼他們不能把 4 倍、10 倍多的晶片組合在一起,因為能源是免費的?他們有數據中心,電力充足卻空置。那種認為中國將無法獲得 AI 晶片的想法完全是胡說八道。他們製造晶片的能力是世界上最強大的之一。半導體行業知道他們壟斷了主流晶片。他們產能過剩,產能太多了。所以那種認為中國將無法獲得 AI 晶片的想法完全是胡說八道。」

這對黃仁勳來說老實說挺尷尬的。

  • 他試圖辯稱中國人不需要他的產品,甚至不應該想要他的產品,他們擁有所有需要的晶片,較差的晶片完全可以勝任同樣的工作,中國的晶片產能過剩。

  • 這簡直是徹頭徹尾的謊言。這非常明顯地完全不是事實。

  • 我盡量不輕易說這種話,但是的,顯然是胡說八道。

  • 我們知道這一點,是因為我們看到中國人在 AI 領域嘗試做的每一件事都存在巨大的實際算力瓶頸。

  • 我們知道這一點,是因為在管制之前,中國擁有的算力大約和我們一樣多,而現在他們的算力只有我們的 10%。

  • 如果中國能做到這一切,並且擁有所需的所有 SCIP 等等,那麼為什麼那些電力充足的數據中心會空置?為什麼沒人有足夠的算力?Sacks 告訴我們的,如果我們不達成正確的協議,那些擁有所有他們甚至不需要的多餘晶片的華為海外數據中心在哪裡?拜託。

  • 黃仁勳繼續吹捧華為。歷史上最強大的一年。他們出貨了大量的晶片。數百萬顆晶片。比 Anthropic 擁有的晶片多得多。他們有充足的邏輯晶片,也有充足的 HBM2 記憶體。他們不需要 EUV 就能製造最先進的 HBM,他們是一家網絡公司。反正算法的改進才是最重要的。

黃仁勳顯然在這裡亂了陣腳。讀起來像是惱羞成怒、憤怒、絕望,並在一個說不通的故事上加倍下注。胡亂拋出說辭看哪個能奏效,只是不停地否認、否認、否認。

  • 把這段和他吹捧輝達時的樣子剪輯在一起應該會很有趣。

  • 我們聽到了「技術棧」的論點。「DeepSeek 不是一個無關緊要的進步。如果 DeepSeek 率先在華為平台上發布,那對我們國家來說將是一個可怕的結果。」Dwarkesh 直截了當地問:為什麼?黃仁勳說,假設它是「為華為優化的」。我們的硬體就會處於劣勢。

我現在甚至不知道該說什麼了。我們為什麼要在乎那個特定的模型在運行時對哪種硬體更有效率一點?這沒有任何區別。這很愚蠢。輝達正在賣出它能製造的每一顆晶片,且在很長一段時間內都會如此,黃仁勳對此並無異議。

  • 黃仁勳直截了當地說,糟糕的結果將是輝達處於特定的競爭劣勢。這有點露餡了,而他馬上就要露得更多。

  • 噢,還有對 DeepSeek 的這種執著還在繼續,黃仁勳再次將其視為「重要的進步」。這是戰術性的。DeepSeek 是一家優秀的實驗室,特別是考慮到其嚴重的硬體限制,但他們的巨大勝利在於學會了如何在算力匱乏的情況下走得驚人地遠,而且他們可能已經有一段時間沒有最好的中國模型了,正如我反覆解釋過的,「DeepSeek 時刻」被嚴重過度炒作了。

  • 「你描述了一個我認為是好消息的情況。一家公司開發了軟體,開發了一個 AI 模型,而且它在美國的技術棧上運行得最好。我認為那是好消息。你把它設定為壞消息的前提。我要告訴你壞消息,那就是世界各地的 AI 模型被開發出來,且它們在非美國硬體上運行得最好。那對我們來說才是壞消息。」

扔麥克風。證明完畢。言盡於此。真相大白。謝謝你,先生。

  • 也就是說,他認為如果中國人開發出了最好的模型,只要它在他的硬體上運行得最好,那就是好消息。那就是勝利。

  • 而如果中國人開發出了一個不是最好的模型,但它在華為晶片上比在輝達晶片上運行得更好,那就是壞消息。那就是失敗。

  • 他關心的只有輝達的硬體銷售。別再假裝不是這樣了。

  • Dwarkesh 問,模型難道不能直接更換加速器嗎?黃仁勳說不能,並說「我就是證據」。輝達的成功就是完美的證據。Dwarkesh 指出人們還是會這樣做,黃仁勳說運行效果不會更好。Anthropic 的模型在三種不同的硬體架構上運行,但「必須投入大量工作來進行那種改變」。

「證據就是我(L’Preuve, c’est moi)。」

  • 這是他貫穿始終的態度。權威已經發話了,平民。

  • 是的,當然,當你直接更換時,運行效果不會更好。輝達的晶片更好,且優化確實有價值。但重點是,在大多數情況下,效率損失是適度的,所以你有什麼就用什麼。

  • 黃仁勳沒有提到 Anthropic 正在三個不同的硬體架構上運行其相同的模型,而且運行良好。你投入工作就行。

  • 這種工作將變得越來越容易,因為 AI 可以完成這些工作。

  • 「但去看看全球南方,去看看中東。如果所有的 AI 模型一出廠就在別人的技術棧上運行得最好,你現在肯定是在提出某種荒謬的主張,說這對美國是一件好事。」

好吧,這純粹是惱羞成怒了。沒人那樣說,在好幾個層面上都沒有。你氣瘋了嗎,兄弟?

  • 讓我們拆解一下。

  • 這裡的「所有的 AI 模型」是從哪裡冒出來的?我們正在討論某些 AI 模型針對非美國硬體進行優化的可能性。最重要的模型,最有可能是最好的模型,不會在那一組中。

  • 這裡的「技術棧」不再包含 AI 模型了。技術棧的重點在於它同時包含硬體和模型,所以這甚至不是一個真正的技術棧。

  • 「在非美國硬體上每單位算力運行效率最高」與「在非美國硬體上運行得最好」之間有著巨大的區別。輝達的硬體優於非美國硬體。所以即使更換時有實質性的效率損失,你仍然會從性能上的巨大差距中獲益。

  • 他同意這只適用於「一出廠」且不「投入工作」的情況,但在未來顯然別人會投入工作,而你將能夠在 AI 的幫助下,從他們投入的工作中獲益,如果那項工作有價值的話。

  • 黃仁勳剛才還在辯稱,不,你的晶片有多好並不重要,你只需要把更多晶片串聯在一起,一切就都解決了。

  • 挺有趣的是,這段針對輝達執行長的反駁,很大程度上是我在吹捧輝達晶片,而他卻在貶低它們。

  • 「為什麼你認為它是完全通用的,如果你不運送算力給他們,它就會完全被華為取代?他們落後了,對吧?他們的晶片比你的差。」「這完全是……現在就有證據。他們的晶片產業是巨大的。」

我不知道還能怎麼說,除了黃仁勳充其量是在胡說八道。

  • 他在說輝達是否向中國出售算力,不會影響中國擁有多少算力。即使面對這種極其微小的聲明,他也要爭辯。

  • 我們要在什麼時候才同意承認這個人是誰、是什麼樣的人?

  • 訪談就這樣持續了一段時間,沒有說出任何新東西,直到我們迎來另一個時刻。

  • 「聽著,為什麼你要讓 AI 行業的一層失去整個市場,好讓你讓 AI 行業的另一層獲益?AI 有五層,每一層都必須成功。最需要成功的層實際上是 AI 應用。你為什麼如此執著於那個 AI 模型?那一家公司?為了什麼原因?」

還有問題嗎?

  • Dwarkesh 在戰術上或許也有一部分責任,因為他還沒有強調為什麼一個國家會希望擁有更多算力獲取途徑的其他原因,特別是以遠低於公平市場價格獲取的算力,這些原因超出了直接的訓練成本。

  • Dwarkesh 仍然是目前最好的訪談者,試圖應對一手非常難打的牌。證人充滿敵意、不配合且不可靠,而他所做的很大一部分工作實際上是爭取到兩個小時與證人交談,甚至直接與他爭論,而黃仁勳沒有憤而離席。這是一項艱苦的工作,就像觀看或閱讀這段內容一樣艱苦。

  • 因此,即使在超級智能和決定性戰略優勢不存在的世界裡,他也未能理解 AI 的經濟影響最終取決於誰為了什麼目的、以什麼數量使用什麼樣的推理。輝達是世界上最有價值的公司,但即使在「AI 作為普通技術」的世界裡,最終他分得的利潤,相對於應用層和模型層來說,也只是蠅頭小利(bubkas)。應用程式之所以成功,是因為你擁有開發、部署和運行應用程式所需的模型和算力。

  • 非常顯然,再次強調,即使在「普通技術」的世界裡,向中國出售輝達晶片也不會造福「美國技術棧」或幫助這所謂蛋糕的其他層。它將在中國的能源上運行,為中國的應用程式運行中國的模型。然後,如果這真的是一個普通技術世界,中國的晶片(很可能是由使用輝達晶片的 AI 設計的)最終會在他們追趕上來後取代美國的晶片。

  • 「那一家公司」這種說法很奇怪,彷彿這純粹是關於 Anthropic。顯然不是,而且 Anthropic 大多甚至不用輝達晶片。只是 Mythos 恰好是能力進步的一個例子。顯然同樣的邏輯也適用於一邊的 OpenAI、Google 和 xAI,以及另一邊的中國公司。

  • Dwarkesh 再次嘗試談論輝達晶片有多好,以及在中國正掙扎於擴展 7 奈米時,輝達正邁向 3 奈米、2 奈米甚至 1.6 奈米。他指出「中國擁有無限能源」是一個論點,即你賣給中國的每一顆晶片,都是中國增加的算力,因為沒有其他限制因素了。

說得好,嘗試得也好。

  • 「聽著,我只是覺得你說話太絕對了。我認為美國應該領先。美國的算力是世界上其他任何地方的 100 倍。美國應該領先。好吧。美國現在領先。」……「為什麼我們不制定一個更平衡的法規,讓輝達能在全球獲勝,而不是放棄世界?你為什麼希望美國放棄世界?」他說,只要只有美國能得到 Vera Rubin,這難道還不夠好嗎?

在這種背景下跳到「100 倍」的說法太瘋狂了。

  • 如果你仔細想想,即使是 10 倍也完全擊潰了黃仁勳早前關於中國不需要更多算力的論點。

  • 再次強調,他關心的只有他的市場份額,並認為這是「放棄世界」。

  • 這也暗示了存在一組固定的市場正在被競爭,而不是存在一個沒人有足夠供應的固定晶片供應量。

  • 難道沒有一個顯而易見的折衷方案嗎?比如如果輝達能製造足夠的晶片來滿足西方需求,那我們就可以談論出售剩餘的部分?不,他也強烈反對這類事情。

  • 黃仁勳稱任何將 AI 與核武器或導彈外殼進行的比較都是「瘋狂」。他稱將算力比作鈾是「糟糕」且「不合邏輯」的類比。他沒有提供任何論據。當被問及零日漏洞問題時,他說你通過「對話來確保人們不以那種方式使用技術」來解決。

他在這點上已經淪為直接的人身攻擊了。

  • 關於網絡安全問題,我重複我上面的邏輯,只想強調這個回答是多麼明顯的天真。中國發布其開源模型。即使你讓中國同意不進行網絡攻擊,即使你讓中國政府本身不親自進行攻擊,即使你讓他們嘗試在中國境內執行這一點,那又怎樣?你要如何執行?即使你設法在中國境內執行了,當北韓人根本不在乎(因為他們顯然不在乎)時,會發生什麼?

  • 再次強調,一個人不能簡單地「同意不將 AI 用於 [X]」,除非只有極少數的參與者可以做 [X],例如涉及現有的核武器時。你必須從一開始就不允許那種能力存在,或者至少你必須對該能力的相關來源進行全球範圍的廣泛監控。先生,請認真對待這件事。

  • 然後他回到說:「讓出整個市場將無法讓美國在晶片層、計算棧中長期贏得技術競賽。」

Dwarkesh 顯然並不是在主張不向中國出售晶片有利於我們長期贏得晶片層。

  • 黃仁勳一直強調這一點,因為那是他唯一關心的事。

  • 既然 Dwarkesh 在這裡沒有提出這個論點,我想應該由我來提出。那麼讓我們分兩部分來做。

  • 首先,輝達已經可以賣出它能製造的每一顆晶片,華為也可以賣出它能製造的每一顆晶片。如果你在中國賣出一顆輝達晶片,那所做的只是物理上將那顆晶片移到中國。如果你做得夠頻繁、夠久且擴展得夠快,那麼是的,情況會改變,但現在不是那種情況。

  • 因此,向中國出售晶片是否會改變中長期的晶片局勢這一點並不顯然,而且幾乎肯定不會影響任何人的短期晶片銷售。除非輝達刻意製造僅供中國消費的晶片,而不是為美國製造晶片。

  • 中國高度重視晶片的自給自足。我會相對更看重其他東西,但這對他們來說是一件非常明智的事情,而且他們不打算放棄。他們也表現出了在中國境內限制輝達銷售以實現這一目標的意願。因此,我們應該得出結論:如果未來輝達在中國的銷售威脅到華為製造和銷售更多晶片的能力,中國將會干預以支持華為。就輝達的銷售在這一點上會產生影響的程度而言,它們將被停止。即使在這種背景下,你也只能做那些本身就是錯誤的銷售。

  • 從長遠來看,一切事物的關鍵限制因素是智能和算力,以及解決各種問題和創造卓越設計的能力。再次強調,即使在像黃仁勳這樣的懷疑論者所預期的「AI 作為普通技術」的世界裡,這也是正確的。如果你賣給中國大量的晶片,而他們擁有更好的 AI 模型和更多的算力來運行它們,他們就會更頻繁地使用那些更好的模型來創造更好的晶片和 EUV 設計,就像他們推進其他一切事物一樣。

  • 同時,那些銷售以直接犧牲我們經濟為代價,強化了中國的經濟,這也損害了我們做任何事情的能力並幫助了他們。

  • 所以不,這甚至在直接層面上也不是「事實」。延緩 AI 晶片出口極有可能在長期 AI 晶片市場上對你有所幫助。

  • Dwarkesh 在狹隘的晶片問題上進行了交流,指出特斯拉和 iPhone 在中國並沒有獲得鎖定效應。黃仁勳在「重要的是我們生態系統的豐富性」上加倍下注。

人們也可以引用無數技術轉移、逆向工程等案例,作為不讓他們獲得晶片的論據。

  • 這裡的「我們」指的是輝達和 CUDA。他不在乎模型或應用程式或經濟活動是否是中國的,因為那不是「我們」。

  • 他似乎對與汽車的類比感到非常受辱,輝達不是汽車,你不能「今天買這個品牌的車,明天換另一個品牌的車,輕而易舉」。

嗯,實際上,是的,你可以,而且人們確實會這樣做。雖然不是在毫無損失且沒有通知的情況下,但沒錯,人們一直在這樣做。

  • 精彩內容不斷:「根據你描述的前提讓出市場,我根本無法承認這一點。這毫無意義。因為我不認為美國是輸家。我們的行業不是輸家。那種輸家的主張、那種輸家的心態,對我來說毫無意義。」「你不需要換話題。我很享受。」

「我根本無法承認這一點。」不,你不能。

  • 「不是輸家。」「那種輸家的心態。」非常耐人尋味。有人被戳到了痛處。

  • 這個人領導著世界上最有價值的公司,產品銷售一空,但他卻害怕成為「輸家」。

  • 但他積極地想讓這場爭論繼續下去,即使 Dwarkesh 意識到這正陷入惱羞成怒的循環中。

  • 「我只是想讓你承認,美國技術產業的任何邊際銷售都是有益的。」「你使用的邏輯,你大可以對微處理器和 DRAM 這麼說。你大可以對電力這麼說。」

黃仁勳不想理解這一點。他認為「美國賣東西」就應該被視為對美國或美國技術產業有好處。

  • 而且他聲稱這是顯而易見的層級,沒人能反駁。

  • 但非常顯然,這個論點證明了太多東西,而且它並非邏輯嚴密。為什麼這筆邊際銷售會淨利於技術產業的其餘部分?

  • 黃仁勳的論點似乎依賴於我們領先「足夠多」,所以回饋一些也沒關係,而有時他又主張相反的觀點。

  • 是的,如果你沒有任何其他資訊,任何給定的邊際銷售都是好事,這是一個正確的預設假設。但在這裡,我們確實有更多的資訊。

  • 「我們有大量的算力。我們有大量的 AI 研究人員。我們正在盡快賽跑。」

我們可以有更多的算力。

  • 如果我們有更多的算力,並且如果我們更願意吸引中國和其他地方的人才,我們可以有更多的 AI 研究人員。

  • 因此,我們並沒有盡快賽跑。

  • 澄清一下:這並不是我在說我們應該賽跑,或者應該盡快賽跑。

  • [更多同樣的論點來回交鋒,黃仁勳繼續說著矛盾的話,並繼續堅持認為沒有矛盾。]

包括說美國電信業基本上被「排擠」出了世界,即使你買帳重商主義論調,這也不是一個描述發生了什麼的好詞,情況也不具有平行性。

  • Dwarkesh 說「我正試圖讓你理解出售晶片的代價」,而黃仁勳的回應是再次重複他所認為的不出售晶片的代價。也就是說,不,先生,我不感興趣。

  • 黃仁勳繼續認為 AI「應用層」才是最重要的,而不是模型層。

但即使那是真的,那仍然是囤積算力的理由。

  • 黃仁勳一直談論整個技術棧「失去世界第二大市場」。他似乎一直在聲稱:如果中國人使用 CUDA 和輝達,那麼我們的技術棧就在模型層和應用層這些最重要的層面上,在有意義的意義上贏得了中國市場。

而我在這裡要說,不,這說不通,即使在「普通技術」的世界裡,如果模型和應用程式是中國的,誰的晶片被使用並不是非常重要。

  • 我不明白除了輝達的利潤之外,這有什麼難理解的。

  • 話又說回來,這正是為什麼我們有一句名言,說在這種情況下讓一個人理解某事是很困難的。

  • 實際上我認為黃仁勳完全理解,只是在裝糊塗。

  • 黃仁勳提出了一個很好的觀點,即如果我們嚇得美國每個人都討厭 AI 並遠離軟體工程,那對我們沒有好處。他回到了放射科醫生的話題,職業與任務之間的區別。

讓美國人討厭平凡的 AI 使用,並恐懼平凡的 AI(或作為普通技術的 AI)對我們生活的影響,以至於美國人拒絕傳播並利用它來造福我們,這確實會是一個巨大的錯誤。我們應該非常努力地避免這種情況。

  • 如果你看數據,美國人對平凡 AI 的反感,與美國人對 AI 存在性風險(甚至是像我這樣的人擔心的災難性風險)的恐懼幾乎沒有關係。

  • 美國人在被提醒時確實會擔心那些事情,有時甚至是不經提醒,但這並非顯著問題。

  • 普通美國人最關心的是工作流失、互聯網充斥著垃圾內容或深度偽造、環境影響等問題。這很不幸,我也試圖勸阻這種想法,但這是我們的現實。而這與出口管制或 AI 存在性風險的問題幾乎沒有關係。

  • 誰在阻礙人們成為軟體工程師?我不確定。我認為大多是那些試圖思考經濟學問題的人。

  • 回到放射科醫生的問題,我會參考我之前的分析,並指出短缺很大程度上是由監管俘虜造成的,因為我們要求醫生,特別是放射科醫生,採取表演性的行動。如果我們願意,我們現在就可以培訓更多的放射科助理從業人員(或任何我們想稱呼他們的名稱),他們可以在依賴 AI 的同時完成工作的剩餘部分,只要我們決定將其合法化。或許當我們那樣做時,短缺最終會加速解決。

  • 我不認為這其中的任何一點與 Dwarkesh 提出的實際問題有關,但它們是與我們這裡的利益相關的事情,當黃仁勳提出一個好的觀點時,我應該強調它,因為我一直在猛烈抨擊他。

  • 黃仁勳指出,光刻技術的進步或許只讓 Blackwell 比 Hopper 提升了 75%,所以輝達的架構才是 50 倍總收益的大部分原因。

好了,每個人都在討論的關鍵部分到此結束。

不同的晶片架構

  • 為什麼輝達不也製造更現代版本的 N7 晶片或類似產品?黃仁勳回答說沒有必要,然後給出了研發成本這個真正的答案。

我買帳。專注對輝達這樣的公司至關重要。最好把所有的工程師都投入到讓下一代晶片好上十倍的工作中。

  • 那完全不同的晶片架構呢?他們沒有更好的主意,他們模擬了其他選項,結果更糟。他正在將 Groq 納入 CUDA,現在代幣(tokens)值得付費了,他希望能更多地投資於輝達架構。

這一切看起來都很公平,除了作為輝達的負責人說「如果我有更多錢」這點很奇怪?看起來他應該擁有這方面所需的所有資金?

  • 如果沒有深度學習,輝達今天會在哪裡?加速計算。

  • 黃仁勳重申他很享受那場訪談。

我可以相信。儘管他看起來非常沮喪和惱火,但像黃仁勳這樣的人多久能有一次真正的爭論?有多少人真的會反擊?在某種程度上,這可能是一種解脫。

  • 我下週要去參加黃仁勳的頒獎典禮,因為我隨機收到了邀請。

網上對出口管制的反應

Daniel Eth 和 Connor Williams 等人認為黃仁勳反對出口管制的論點是完全不道德的,純粹是為了賺錢,而且完全說不通。還有許多其他人也持相同觀點。

Dmitri Alperovitch:與黃仁勳的精彩訪談。他公然承認他對出口管制的聖戰純粹是為了讓輝達在全球銷售更多晶片,而不是為了國家安全或在與中國的 AI 競賽中獲勝(他之前說過即使我們贏了也不重要)。

我認為這類反應稍微嚴厲了一點。但基本上是的,這些是黃仁勳能提出的最強論點,而它們相當薄弱。

Tenobrus:Dwarkesh 訪談中的黃仁勳並非「錯誤」本身。他只是不在乎真相。他在乎的是賣出盡可能多的輝達晶片,無論後果如何。他非常明顯地在進行動機性推理來為此辯護。我們還能期待什麼呢?

如果我對黃仁勳作為思想家、傳播者、人道主義者和美國人的評價原本很高的話,這會降低我的評價。但事實並非如此。我對他作為商人的評價很高,而作為商人,他想把晶片賣給中國。

深深感謝 @dwarkesh_sp 在這裡如此努力地推進。我希望黃仁勳在此問題上的邏輯不通能被更多人看到,讓輝達未來更難為自己辯護。

Alec Stapp:這是黃仁勳和 Dwarkesh 關於出口管制的關鍵時刻:

  1. Dwarkesh 詢問,考慮到 Mythos 等 AI 模型對國家安全的影響,向中國出售輝達晶片為什麼是可以接受的。

  2. 黃仁勳給出了一個誤導性的回答,辯稱向中國出售美國晶片是可以接受的,因為中國已經生產了世界上 60% 的晶片。

  3. 但正如黃仁勳肯定知道的那樣,算力是以 flops 衡量的,而不是晶片數量。

  4. Dwarkesh 隨後進行了反擊,指出在 flops 的基礎上,中國的算力只有美國的 10%,給予他們更多算力將改變他們的網絡能力。

這次交流顯示了為什麼訪談者具備至少一些技術知識至關重要,這樣他們才能反擊誤導性的談話要點。

Alex Imas:黃仁勳幾個月來似乎一直在進行 24/7 的訪談循環,而從一開始,頭號問題就應該是這次交流。

我不知道這是因為舊媒體的衰落——記者們不再以過去那種「調查式」風格進行推進和提問——還是別的原因。但我很高興我們有 @dwarkesh_sp 來做研究並揭露真相。

William Buckskin:我喜歡黃仁勳,但這正是我們需要政府的原因。

為了他的投資者,他會把我們賣給中國。我們顯然不能允許這種情況發生。

我不至於過度責怪黃仁勳作為一個資本家,想把東西賣給任何想買的人,並把決定權留給別人。問題在於他一直試圖誤導我們以獲得許可。

在這些交流中,也有人試圖為黃仁勳辯護,如果你點進去就能找到他們,但我發現那些論點也相當貧乏。來自 Ed Elson 的這篇是我見過最認真的嘗試,但如果你仔細思考,他自己的隱喻反而指向了另一個方向。

這裡有一個完整的解釋,回應了精簡版

Peter Wildeford:黃仁勳在這裡令人沮喪且錯誤。這個人註銷了數十億美元,所以他當然反對管制。

  1. Mythos 是一個在 Amazon Trainium 上訓練的約 10 兆參數模型。儘管黃仁勳盡了最大努力,但多虧了出口管制,中國並沒有 [Blackwell 或類似能力的] 晶片。

華為最好的晶片提供的單晶片性能只有 1/3,功耗是 2.5 倍,良率差了 12 倍以上。黃仁勳稱 Mythos 是「在中國豐富可用」的「相當平凡的能力」,這簡直是公然的謊言。

  1. Dwarkesh 說得對,算力比例在地理政治上很重要。在關鍵窗口期——甚至是 12-18 個月——保持能力領先,正是管制的全部意義。中國運行一千個與一百萬個攻擊性 AI 代理之間的區別是巨大的。黃仁勳完全迴避了這一點。

  2. 黃仁勳不能同時主張「管制失敗了,因為中國無論如何都會創新」(DeepSeek)以及「我們必須賣給中國,否則他們會離開我們的生態系統」。如果他們無論如何都會創新,出售晶片並不能買到他所聲稱的忠誠。

  3. 黃仁勳關於生態系統黏性(x86, Arm)的觀點是他最強的論點,但這反而對他不利:世界已經被鎖定在 CUDA 中了。向中國出售輝達晶片並不會加深這一點——這只是在中國無論如何都會構建華為替代方案的同時,給予他們更好的硬體。

好幾個人都強調了一個顯而易見的觀點,我也注意到了:如果中國有能源來使用無限的晶片,那正是不要賣給他們晶片的更多理由。

Theo Bearman:黃仁勳談中國:「他們擁有的能源量是驚人的。不是嗎?AI 是一個並行計算問題,不是嗎?為什麼他們不能直接把 4 倍、10 倍多的晶片組合在一起,因為能源是免費的?他們有這麼多能源。他們有完全空置、電力充足的數據中心。你知道他們有鬼城,他們也有鬼數據中心。他們有這麼多基礎設施能力。如果他們想,他們只需聚集更多晶片,即使它們是 7 奈米。」

這正是為什麼我們需要加強對半導體製造棧所有元素的出口管制,而不是幫助中國最大限度地利用他們在隨時可部署的電力外殼方面的優勢,再加上領先的美國 GPU 和「全球 50% 的 AI 研究人員」。美國目前沒有那種奢侈,電力和冷卻組件的交付週期很長,許可和數據中心建設也是如此。

隨著英國 AI 安全研究所(UKAISI)現在表示 AI 能力每四個月翻一倍,黃仁勳試圖讓中國迷上美國技術棧的策略最終結果將只有一件事:放棄西方 AI 優勢,或許是永久性的。當然,重手出口管制可能有副作用,但另一種選擇要糟糕得多。

Peter Wildeford:黃仁勳顯然也在 Dwarkesh 的訪談中無意中為出口管制提供了依據:

「他們 [中國] 有完全空置、電力充足的數據中心。你知道他們有鬼城,他們也有鬼數據中心。」

想像一下如果中國有了晶片!

Peter 還解釋說,華為目前只能滿足中國市場需求的 1%-4%,而且中國政府無論如何都會確保對華為晶片的無限需求,如果時機成熟,他們會為了實現這一點而排擠輝達。

是的,華為的產量會隨著時間推移而擴大,儘管由於瓶頸,短期內可能不會。但即使他們擴大了,中國的需求也會擴大,而且顯然他們並沒有走在追趕的道路上,即使產品較差。

這是否與「入戲 AGI」有關?

這無疑是你如何看待此類論點的一個主要因素,也理應如此,但正如我貫穿始終所說的,我不認為你需要相信 AGI/ASI 才能認為黃仁勳在出口管制上是錯誤的。

Sriram Krishnan:這裡每個人對黃仁勳 + @dwarkesh_sp 播客的反應,都可以直接從他們是否相信前沿實驗室能在短期內實現 AGI/ASI 來推斷。

如果你相信實驗室會在未來幾年內實現 RSI(遞歸自我改進)然後是 AGI/ASI(根據這三者的某種定義),你可能會同情 @dwarkesh_sp 採用的框架。

如果不相信,你可能會更同情黃仁勳的論點。

(如果這裡有任何人不符合這種模式,我很想聽聽!)

我會這樣看:

  • 如果你相信 AGI/ASI 在中期內(即約 10 年內)是可能的,那麼黃仁勳反對出口管制的案例完全沒有說服力。

你仍然可以提出反對出口管制的論點,這些論點可能有一些價值,但我會將那些論點歸類為「銀河腦(galaxy brain)」見解。

  • 如果你不相信 AGI/ASI 在 10 年內是可能的,甚至可能無限期推遲,那麼你應該對黃仁勳的論點持更開放的態度,但你仍然應該出於我貫穿始終所論證的原因而拒絕黃仁勳的論點。

Dean Ball 在這裡提出了一個相關的觀點。鑑於 Mythos 以及對 AI 在未來幾年能做什麼的任何合理預期,你不需要相信「AGI」,你只需要相信 AI 的重要戰略影響,而我們今天已經達到了那一點,這足以使黃仁勳的案例失效。

  • 如果你不僅不相信 AGI/ASI 是可能的,而且你還認為在中期內誰擁有大部分算力並不重要,且人們使用誰的模型和應用程式也不太重要,那麼且僅在這種情況下,黃仁勳的論點才是強而有力的。

也就是說,你認為 AI 不太重要,所以不如在晶片上賺錢。

  • 但如果是這樣,你可能也應該做空市場,特別是輝達。

  • 你做空市場了嗎?

  • 而且,我們根本不住在這樣一個世界裡。在 Claude Code 和 Codex、GPT-5.4、Opus 4.6+ 以及 Mythos 之間,我們已經排除了這種可能性。

  • 你可以為黃仁勳的論點做一個「鋼人化(steelmanned)」版本,就像 David Sacks 等人所做的那樣,即輝達硬體和 CUDA 在中國的主導地位也會導致美國模型和應用程式的主導地位,因為它們形成了一個連貫的「技術棧」。

我認為這個論點在實質上是錯誤的,原因有很多,即使你不相信 AGI/ASI,因為它描述了一個我們並不住在其中的世界。

  • 我可以想像這樣一個世界的存在,但它看起來會非常不同。

我們應該如何看待黃仁勳未能找到更好的論點?

Dean W. Ball:黃仁勳在這裡大多失敗了,這真遺憾,因為出口管制上的單一文化是糟糕的。如果你是一個試圖成名的年輕 AI 政策研究員,除非你支持出口管制,否則幾乎不可能被認真對待。單一文化通常是糟糕的。

政策辯論不應該顯得只有一面,除非那一面是:

  • 讓其他人都變得更糟,好讓我能賺更多錢。

  • 不。

立場一通常會在這種辯論中獲勝,因為特殊利益集團非常在乎集中的利益,而其他人則不太在乎分散的成本。但是,是的,在有人尋求租金或尋求做一些破壞性事情的情況下,你在實質上會得到一場非常一面倒的政策辯論。

如果政策辯論是一面倒的,我想相信政策辯論是一面倒的。

如果政策辯論不是一面倒的,我想相信政策辯論不是一面倒的。

因此,如果存在反對出口管制的好論點,我們想聽聽,即使最終我們認為出口管制是好的。而且,如果它們存在,我還沒聽過。

缺乏足夠的「入戲」也是黃仁勳「失去」Anthropic 的原因,也是目前的美國政府在一個錯誤更難以理解的時期試圖「失去」Anthropic 的原因。

Dean W. Ball:在這方面,黃仁勳/Dwarkesh 訪談中最有趣的一刻不是關於晶片出口管制的辯論,而是黃仁勳說他在幾年前被接洽投資 Anthropic 時,並不了解他們的規模化需求。他承認自己當時「未入戲」。

那些被黃仁勳視為技術盲的拜登政府官員和 EA(有效利他主義者),在幾年前會比黃仁勳在訪談中承認的更直觀地理解 Anthropic 的規模化需求。這與精明或智力無關,而與「入戲程度」有關。

Matt Beard 提出了一個極好的觀點,並強調黃仁勳在試圖貶低 TPU 時說「雖然 AI 是今天的對話主題」,所以沒錯,他仍然高度「未入戲」。

黃仁勳的論點在邏輯和修辭上都很貧乏

一個論點(至少)有兩種貧乏的方式。

  • 一個論點可能在邏輯上很貧乏,缺乏潛在的價值。

  • 一個論點可能在修辭上很貧乏,對聽眾沒有說服力。

黃仁勳的論點,以及一般的 AI 加速派論點的問題在於,它們通常在意義 #1 上很貧乏,且在意義 #2 上始終很貧乏,至少在應用於一般政治或公眾時是如此。

Anton Leicht 正在警告加速派,他們正在緩慢但肯定地失去陣地。其策略一直是反對任何及所有要求,堅持不讓步並玩純粹的硬派政治,卻沒有修辭和支持來支撐,而未能嘗試塑造最終規則或走在實際傷害之前,這種做法在遭遇慘敗之前一直有效。

那些買帳這些論點的人一直相當小眾,隨著 AI 能力的進步,這一點每天都變得更加真實,包括今天有了 Opus 4.7。

Dean W. Ball:Dwarkesh/黃仁勳揭示了 AI 加速談話要點是多麼不一致且未經實戰檢驗,特別是當它們經過企業公關和大眾政治的過濾時。戰略上連貫的加速主義是可能的(我正在嘗試!),但目前並不盛行。

我真的是作為一個根本上的加速派說這話的。一直以來都很清楚,特別是在 SB 1047 期間發展起來的默認 AI 加速立場是經不起時間考驗的(默認的反 1047 論點取決於 AI 不會改善太多,以及一種將傳播視為「完全棘手的神秘問題」而非「障礙」的滑稽觀念;這基本上仍然是默認的 AI 加速論點),需要一條新的、更複雜的路徑。

我試圖以我自己的大多在字裡行間的方式繪製這條路徑,但我現在要明確一點:對於那些對 AI 感到興奮、認為它更有可能發展良好(特別是在大風險得到稱職管理和具有自覺的戰略執行情況下)並希望敏捷地擁抱它的人來說,顯然需要一種新方法。

Dean W. Ball:然而,必須承認,儘管黃仁勳是在言辭潰敗中說出這句話的,「那種輸家的前提對我來說毫無意義」這句話確實很霸氣。

Nathan Calvin:聽完那場訪談後,我完全沒有被黃仁勳的論點說服,但我確信這個人是一股自然力量,有一種殘酷的原始技術資本家式的酷。

Dean W. Ball:在某種意義上,這種炫耀一直就是邏輯上的不一致。

我認為「輸家的前提對我來說毫無意義」這句話非常能體現黃仁勳的心理。

我認為這是因果關係。也就是說,那個前提會讓我成為輸家,因此它毫無意義。

因為關於黃仁勳,有一件事是必須知道的?他是一個贏家。

討論

Lesswrong

相關文章

其他收藏 · 0

收藏夾