AI 的前景與晶片的脆弱性

AI 的前景與晶片的脆弱性

stratechery·

AI 產業比以往任何時候都更令人興奮,但晶片形勢非常不穩定,需要採取果斷行動。

Image

Stratechery Plus

了解更多 | 會員論壇

Image

Stratechery Plus

了解更多 | 會員論壇

最新播客

Image

AI 的前景與晶片的脆弱性

收聽播客

在 YouTube 上觀看

收聽本文:

昨天 Anthropic 發布了 Claude Sonnet 3.7;Dylan Patel 發表了當日最佳笑話,調侃 Anthropic 似乎對數字「4」有種排斥感(「4」在中文裡諧音「死」):

Anthropic 也是一家中國 AI 公司,因為他們非常忌諱數字「4」。

玩笑歸玩笑,Ethan Mollick 對這篇文章的修正建議指出,Anthropic 沒有增加主版本號,是因為就運算量而言,Sonnet 3.7 仍屬於 GPT-4 級別的模型。

在發表這篇作品後,Anthropic 聯繫了我,告訴我 Sonnet 3.7 不會被視為 10^26 FLOP 級別的模型,其訓練成本約為數千萬美元,儘管未來的模型規模會大得多。我已根據該資訊更新了文章。唯一重大的變化是,Claude 3 現在被稱為先進模型,但不再被視為第三代(Gen3)模型。

我非常欣賞 Mollick 的工作,但我拒絕他那種中立的命名方案:誰先達到某個世代,誰就理應獲得該名稱的榮譽。換句話說,如果第二代(Gen2)模型是 GPT-4 級別,那麼第三代(Gen3)模型就是 Grok 3 級別。

而且,Sonnet 3.7 是 Sonnet 3.5 那種迷人的個性與編程能力結合的演進,這可能是 Anthropic 在訓練後處理(post-training)中加入某種特殊配方的結果;相比之下,Grok 3 感覺更像是一個運算能力階梯式增長的產物,其人類回饋強化學習(RLHF)層要薄得多。它的回答更深入、更詳細(模型很棒!),但經常變得過於冗長(缺乏 RLHF);它能算對數學題(模型很棒!),但其解釋卻較難跟隨(缺乏 RLHF)。它也更願意生成禁忌內容,從情色文學到炸彈配方,表面上帶有 Tumblr 的政治敏感度,但如果你進一步挑釁,底層則更接近 4chan。^1 Grok 3 比以往任何模型都更像是網際網路的精華濃縮;它是目前為止我最喜歡的模型。

Grok 3 同時也提醒了我們「速度」有多重要,進而說明了在具備推理能力的 AI 世界中,基礎模型為何依然重要。Grok 3 的速度明顯快於競爭對手,這帶來了更好的用戶體驗;更廣泛地說,對話是機智反應的領域,而非深思熟慮者的領地。後者是我希望用來做研究或其他代理型任務的工具;前者則能在聊天機器人或語音介面中提供更好的消費者體驗。

與此同時,ChatGPT 仍擁有最佳的產品體驗——尤其是它的 Mac 應用程式顯著優於 Claude^2 ——而且它能以更友善的方式處理像數學作業這類偏消費者的使用案例。而其「深度研究」(Deep Research)功能則明顯優於所有競爭對手(包括 Grok 的「深度搜尋」),對我而言,這是目前為止最接近通用人工智慧(AGI)的體驗。

然而,OpenAI 最大的資產是 ChatGPT 這個品牌及其相關的心智佔有率;營運長 Brad Lightcap 剛告訴 CNBC,該服務的週活躍用戶已突破 4 億,在不到 3 個月內增長了 33%。正如我在 ChatGPT 發布四個月後所宣稱的,OpenAI 是一家「意外轉型」的消費科技公司。消費科技公司是最難建立的,且最具備成為最高價值企業的潛力;它們也需要與帶有 API 業務的研發機構完全不同的文化和價值鏈。我懷疑這正是驅動 OpenAI 過去兩年半以來大部分動盪的根本現實:長期在 OpenAI 工作的員工並不是為了成為下一個 Google 搜尋或 Meta 而加入的,微軟也沒興趣只當一個必須掌控消費者關係才能成功的公司的零組件供應商。

事實上,OpenAI 的動作太慢了:這家公司現在絕對應該推出廣告支持的版本,無論這個想法多麼讓 AI 研究人員感到毛骨悚然;從 DeepSeek 現象中可以得到的一個啟示是,許多消費者並不了解 OpenAI 最好的模型有多強,因為他們不是付費用戶。讓免費效戶能以成本效益高的方式使用最好的模型,這非常符合 OpenAI 的競爭利益,而這意味著廣告。更重要的是,消費科技公司真正擴展到全球的唯一途徑就是擁有廣告模式,這能在最大化潛在市場的同時,仍能持續提高每用戶平均收入(這當然不排除訂閱模式;事實上,廣告+訂閱是消費內容業務的終極歸宿)。

與此同時,DeepSeek 成為了今年最大的新聞,部分原因是它是 Grok 3 的對立面。DeepSeek 的 V3 和 R1 模型是 GPT-4 級別中優秀且強大的競爭者,它們透過在基礎設施和模型層極其出色的工程技術實現了這種卓越;另一方面,Grok 3 只是購買了最頂級的 Nvidia 晶片,利用公司的網絡技術建立了迄今最大的運算集群,產出了一個更好、但並非天文數字般領先的模型。

DeepSeek 是中國公司這一點至關重要,原因我將在下文詳述,但同樣重要的是它是一個開放實驗室,定期發布論文、完整模型權重和底層源代碼。DeepSeek 的模型——既優於 Meta 的 Llama 模型,又更加開放(且不受「類開放」許可證的束縛)——為「最低開放能力」設定了標竿;任何處於或低於 DeepSeek 水準的模型,都沒有理由不開源。當你可以直接運行 DeepSeek 時,安全疑慮已成空談,而競爭疑慮與因模型較差且封閉而導致的採用率和關注度損失相比,顯得微不足道。

同時,DeepSeek 和 Llama 都對定價產生了巨大壓力;為了應對這家中國研究實驗室的發布,美國和中國的 API 成本都已下降。長期保持利潤率的唯一方法,要麼是在基礎設施上擁有成本優勢(如 Google),要麼擁有可持續的模型能力優勢(可能是 Claude 與編程),或者成為聚合者(Aggregator,這正是 OpenAI 應該透過 ChatGPT 追求的目標)。

AI 晶片的現狀

對於那些不那麼擔心 AI 毀滅人類(p-doom)的人來說,這一切都是好消息。目前 AI 似乎處於一個「金髮姑娘」(Goldilocks)般的完美平衡點:領先的研究實驗室有足夠的動力籌集資金並繼續投資新的基礎模型(希望能建立一個能自我改進的 AI),即使競爭無情地壓低了 API 價格,進一步激勵模型製造商開發差異化的產品和功能。

當然,最大的贏家依然是 Nvidia,其晶片由台積電(TSMC)代工:DeepSeek 的成功導致中國對 H20(Nvidia 為了遵守出口管制而推出的 H200 降規版)的需求激增,即便 xAI 剛剛證明了競爭最快的方法就是購買最好的晶片。DeepSeek 的創新將使其他模型更有效率,但可以合理地認為,這些效率提升是晶片禁令的產物,而且可以理解為什麼那些能買到最好晶片的公司之前沒有追求——但肯定會借鑒!——類似的收益。

後一點對 AMD 來說尤其是一個問題:SemiAnalysis 去年底發布了一份殘酷的分析,展示了這家 Nvidia 競爭對手的軟體相對於其硬體是多麼糟糕;AMD 承諾會做得更好,但坦白說,「硬體強大卻受限於軟體平庸」一直是 AMD 存在五十年來的寫照。像 Meta 或微軟這樣的部分公司可能會投入精力編寫更好的軟體,但領先的實驗室既沒有時間也沒有專業知識。

華為及其昇騰(Ascend)系列 AI 晶片的情況則不同。這些晶片是在中國中芯國際(SMIC)的 7 奈米製程上製造的,使用的是西方製造的深紫外光刻機(DUV)和四重曝光技術;這能實現並不令人意外,但可以合理假設,如果沒有中國供應商開發出極紫外光刻機(EUV),該晶圓廠將無法進一步突破(不,把 7 奈米製程的演進稱為 5.5 奈米並不算數)。

儘管如此,AI 晶片的主要限制——特別是在推理方面——不一定是晶片速度,而是記憶體頻寬,這在目前的製程水平上是可以改進的。此外,克服使用低效率晶片必要性的一種方法(在某種程度上)是簡單地建造更多擁有更多電力的數據中心,這正是中國比美國更擅長的事情。最重要的是,中國的科技公司有動力——也有軟體實力——使昇騰晶片成為有力的競爭者,特別是在推理領域。

還有一個參與者應該與 Nvidia/台積電和華為/中芯國際並列提及,那就是自行設計晶片的超大規模雲端服務商(Hyperscalers),無論是獨立設計(AWS 的 Trainium 和微軟的 Maia),還是與博通(Broadcom)合作(Google 的 TPU 和 Meta 的 MTIA)。這些努力的能力和重要性各不相同——Google 投資 TPU 已有十年,並在其上訓練自己的模型,而 Anthropic 的下一代模型正使用 Trainium 訓練;Meta 的 MTIA 專注於推薦系統而非生成式 AI,而微軟的 Maia 則是一個較初期的嘗試——但它們的共同點是,它們的晶片都由台積電代工。

台積電與 Intel

台積電的主導地位並不令人意外。是的,包括本網站在內的許多媒體都報導過 Intel 的失誤和台積電的崛起,但即使 Intel 設法保持在領先地位——而且 18A 看起來很有希望——該公司仍面臨轉型問題:它必須從一家設計並製造自家晶片的整合元件製造商(IDM),轉型為一家擁有客戶服務、IP 庫和為第三方(如我剛提到的所有實體)製造晶片經驗的代工廠。

以 Nvidia 為例,即使在 Intel 擁有領先製程時,Nvidia 也是在台積電(和三星)製造晶片;事實上,正是台積電的創立及其純代工模式,才讓 Nvidia 的誕生變得可能。^3 這也意味著台積電不僅擁有領先製程的產能,還擁有成熟製程的產能。世界上有大量的晶片——無論是在 AI 伺服器中,還是在從汽車、音響到冰箱的所有設備中——並不需要最尖端的技術,它們受益於台積電仍在維護(主要在台灣)的已完全折舊晶圓廠所提供的低成本。而台積電反過來可以利用這些現金流——加上領先製程不斷上漲的價格——投資於最尖端的新晶圓廠。

那些領先製程晶圓廠的造價持續飆升,這意味著產量至關重要。這就是為什麼早在 2013 年本網站創立時,我就清楚 Intel 需要成為一家代工廠;遺憾的是,該公司沒有採納我的建議,而是寧願看著股價在雲端伺服器需求的推動下飆升。轉眼到了 2021 年,Intel——此時已不再處於領先地位,且其雲端伺服器業務正被利用台積電優越製程而復甦的 AMD 蠶食份額——在 Pat Gelsinger 的領導下嘗試成為代工廠;不幸的是,該公司日益萎縮的現金狀況大於其代工客戶群,而後者大多是實驗性晶片或 x86 變體。

Intel 的核心問題可以追溯到上述觀察:成為代工廠不僅僅是擁有領先製程;如果 Intel 曾與渴望使用世界最佳製程的客戶合作,或許能培養出這些技能,但一旦 Intel 連製程優勢都失去了,它就一無所有。當台積電是一個選項時,蘋果、AMD 或 Nvidia 根本沒有理由去承擔與 Intel 合作的巨大風險。

中國與變動中的世界

台積電的總部當然在台灣;那是公司的研發中心和領先製程晶圓廠所在地,以及大部分成熟製程產能所在地。中芯國際顯然在中國;另一家代工廠三星則在韓國。我在去年秋天的《建設的機會》(A Chance to Build)中講述了為什麼這個產業的大部分最終都落腳於亞洲:

半導體與矽谷的歷史密不可分,甚至賦予了這個地區名字,更重要的是賦予了它文化:晶片需要巨額的前期投資,但相對於大多數其他製造成品,其邊際成本極低;這一經濟現實推動了風險投資模式的發展,為那些理論上可以在規模化後獲得無限回報的公司提供無擔保的創業資金。這種模式在軟體領域運作得更好,因為軟體是可以完美複製的。

這段歷史始於 1956 年,當時 William Shockley 創立了 Shockley 半導體實驗室,將他在貝爾實驗室參與發明的電晶體商業化;他選擇山景城(Mountain View)是為了靠近他生病的母親。一年後,由 Robert Noyce 領導的所謂「八叛逆」離開並在路對面創立了快捷半導體(Fairchild Semiconductor)。六年後,快捷半導體在香港開設了一家工廠來組裝和測試半導體。組裝需要手動將導線連接到半導體晶片上,這是一項勞動密集且單調的任務,在美國當時約 2.50 美元的時薪下很難經濟地完成;而香港的工資只有其十分之一。四年後,德州儀器在台灣開設了工廠,那裡的時薪為 0.19 美元;兩年後,快捷半導體在新加坡開設了另一家工廠,那裡的時薪為 0.11 美元。

換句話說,你可以說矽谷的經典故事並不完全誠實。晶片確實有邊際成本,但在矽谷創立後的幾年內,這些邊際成本就被出口到了亞洲。

我在那篇文章中敘述了這種外包如何成為美國政府的刻意政策,並展開了關於戰後「美式和平」(Pax Americana)全球秩序的更廣泛討論,該秩序將美國消費市場置於全球貿易的中心,以美元計價,以及為什麼這不可避免地導致了美國製造業的衰落,以及中國這樣一個國家的崛起——回過頭看,中國對美國來說實在太龐大,因此也太昂貴了,以至於美國無法承受。

無論如何,這可以作為解讀第二任川普政府釋出的許多信號的框架,包括對北美採取的似乎是「門羅主義 2.0」的做法、試圖讓美國從烏克蘭衝突及更廣泛的歐洲事務中抽身,以及,嗯,起初對中國採取或許較溫和的做法,至少與川普在競選期間的言論相比是如此。

一種可能性是,川普實際上正在執行美國總統們談論多年卻未能落實的「轉向亞洲」(pivot to Asia);在這種觀點下,美國正整裝待發以保衛台灣及亞洲其他實體,並希望在此過程中拆散日益增長的中俄關係。

另一種解釋則更令人沮喪,但也許更現實:川普總統可能認為,自蘇聯解體以來作為常態的、由美國主導的單極世界即將結束,美國主動轉向新常態,總比被動接受要好。

與本文相關的重要啟示是,台灣在兩種情境下都是閃燃點。「轉向亞洲」是為了準備防禦台灣免受中國潛在的入侵或封鎖;「退守美洲」則可能是默許——或承認——中國作為亞洲的霸主,這將不可避免地導致台灣被中國併吞。

不用說,這是一個我談論起來非常謹慎的話題,不僅因為我在台北斷斷續續住了二十多年。而且,當然還有道德層面的因素,台灣是一個充滿活力的民主國家,其人民對與中國統一沒有興趣。為此,現狀雖然荒謬,卻出奇地可持續:台灣在幾乎所有方面都是一個獨立國家,擁有自己的邊界、軍隊、貨幣、護照,以及——對科技界至關重要的——經濟,且日益由台積電主導;與此同時,台灣沒有宣布獨立,而美國的官方立場是承認中國認為台灣是其領土,但不背書該立場或台灣獨立。

根據我的經驗,中國人和台灣人確實比美國人更容易處理這種模糊性;儘管如此,灰色地帶的作用是有限的。同樣重要的是現實主義因素,如軍事力量(曾有利於台灣,現在顯然有利於中國)、經濟聯繫(台灣與中國、中國與美國之間極其深厚)以及發動戰爭的可信度。在這裡,烏克蘭衝突以及隨之而來的中俄關係顯得尤為重要,這歸功於軍事技術的共享以及由此產生的石油和糧食陸路供應鏈,即便美國已經消耗了自己。延伸開來,這涉及另一個變動因素:美式和平下美國製造業的空洞化,與中國在「製造業」這一最核心戰爭能力上的主導地位直接相關。

儘管如此,還有一個——或者說曾有一個——關鍵因素可能讓中國猶豫:台積電的重要性。晶片支撐著現代經濟的方方面面;AI 的興起以及隨之而來的巨大收益前景,只會讓這種需求變得更加迫切。只要中國還需要台積電的晶片,他們就有強大的動力不去動台灣。

川普、台灣與台積電

然而,任何關注過去幾年新聞的人肯定都能看出問題所在:從 2018 年最初針對中興通訊(ZTE)的行動開始,各種版本的晶片禁令產生了一個或許非預期的後果,即讓中國減少了對台積電的依賴。我在中興禁令發生時寫道:

長期來看,硬體層面很可能也會發生分離;中國已經在晶片領域投入巨資,這一行動肯定會促使該國專注於美國、台灣和日本所擅長的那種相對低產量、高精度的組件(到目前為止,中國公司專注於高產量、低精度的組件總是更有意義)。要追趕肯定需要時間,但如果這一行動對中興的傷害如看起來那麼大,我懷疑其投入將會比現在更加顯著。

兩年後,在川普總統於 2020 年禁止華為使用台積電晶片後,我補充道:

不用說,我不會深入探討中台關係(以及扮演重要角色的美國)的細節;這與其說是理性的人可能會有分歧,不如說期待理性可能太過天真。只需注意到,如果美中真的開戰,很可能是因為台灣。

在這方面,台積電特別是台灣的製造基地,是一個顯著的威懾力量:中國和美國都需要接觸世界上最好的晶片製造商,以及全球電子供應鏈中一系列其他高精度環節。這意味著一場熱戰,幾乎肯定會導致這些能力的某種程度毀滅,將是災難性的……將中國與台積電隔絕的風險之一,就是台積電營運的威懾價值被削弱了。

現在你可以看到金髮姑娘粥裡的蒼蠅了!中國當然想要台積電最好的晶片,但他們正在摸索如何利用中芯國際、昇騰晶片和驚人高效的尖端模型來應對;另一方面,美國的整個 AI 經濟——那個發展得如此良好、私人資金追求前沿、整個產業鏈充滿競爭與創新的經濟——則完全依賴於台積電和台灣。我們創造了一個局面:中國對台灣的依賴在減少,而我們對台灣的依賴卻在增加。

這是理解川普總統提出的另外兩個「他會不會這麼做」想法的必要背景;這兩者都總結在這篇《外交政策》(Foreign Policy)的文章中:

美國總統川普誓言要對台灣半導體產業徵收關稅,此前曾指責台灣竊取了美國的晶片產業……現任政府的主要戰略目標是振興美國的先進半導體製造……隨著台積電與白宮之間的談判展開,幾種方案正在浮現。

討論最多的方案是台積電、Intel、美國政府以及博通、高通等美國晶片設計公司之間的交易。多份報告指出,白宮提議讓台積電收購 Intel 代工服務(IFS)的股份,並在 IFS 從 Intel 拆分後在其營運中發揮領導作用。其他報告則暗示可能成立由台積電、Intel、美國政府和產業合作夥伴參與的合資企業,並由台積電提供技術轉移和技術支持。

這種提議的動機很明確:去年底解雇 Gelsinger 的 Intel 董事會似乎想退出代工業務,而博通或高通是其設計部門的自然歸宿;然而,美國是那個需要在本土擁有領先代工廠的實體,而川普政府正試圖強迫台積電促成此事。

遺憾的是,我不認為這個計劃是個好主意。一家代工廠根本不可能「接管」另一家:雖然最終產出是一樣的——微處理器——但製程中的幾乎每一步都存在多方面的差異。電晶體——即使是同一級別的——也可能有不同的尺寸和佈局(例如,台積電的電晶體封裝更密集);生產線的組織方式可能不同,以適應不同的光刻方法;化學品是針對個別製程調配的,不能共用;設備是為特定生產線量身定制的,不能隨意更換;整個晶片的材料可能不同,準備和應用的具體方式也不同。當然,大部分設備可以重新利用,但你不能簡單地將台積電的製程套用在 Intel 的晶圓廠上!你最多只能希望台積電能根據其規格,利用現有設備重建晶圓廠。

然而,這並不能真正解決台灣問題:台積電的總部仍在台灣,研發部門仍在台灣,且仍受限於台灣政府不出口最尖端製程的指令(是的,川普抱怨台灣將台積電視為確保美國在中國入侵時保衛台灣的籌碼,這話並非毫無根據)。此外,美國的晶片問題不僅在於領先製程,還在於成熟製程。我在《晶片與中國》(Chips and China)中寫道:

值得指出的是,這正在為美國產生一種新的負債,並可能為台灣帶來更多危險……這些晶片製造起來並不困難,但這正是為什麼在美國建造新的成熟製程晶圓廠毫無經濟道理:台灣已經涵蓋了這部分(在兩個類別中都擁有最大的市場份額),而中國有動力建造更多,僅僅是為了學習。

但是,如果台積電從棋盤上消失了呢?

許多關於潛在入侵台灣的討論——這將摧毀台積電(晶圓廠在戰爭中無法生存)——都圍繞著台積電在高階晶片上的領先地位。這種領先是真實的,但 Intel 儘管掙扎,也只落後幾年。這在智慧型手機、高性能運算和 AI 所使用的處理器方面是有意義的差距,但美國仍在賽局中。矛盾的是,更難取代的是成熟節點的晶片,它們是在 Intel 很久以前就放棄的晶圓廠中製造的……

中國越是建立起自己的晶片能力——即使只是在成熟節點——就越有動力將台積電視為目標,不僅是為了剝奪美國的先進能力,也是為了剝奪那些比我們意識到的更融入日常生活的基礎晶片。

現任政府關注台積電和台灣問題是件好事:我不確定是否有人意識到這種依賴有多深,以及美國——和我們在 AI 領域的未來——實際上有多麼脆弱。

該怎麼做

到目前為止我所寫的一切,在某些方面都是淺顯的:識別問題和批評提議的解決方案很容易;提出自己的解決方案則難得多。問題不在於缺乏創意,而在於是否有勇氣做出取捨:事實上,對於美國在台灣和晶片問題上所處的境地,並沒有完美的解決方案。這是一段長篇大論的開場白,旨在說明接下來的提議包含了一些想法,孤立來看,我會覺得它們有些令人反感、違背我的原則,甚至極其危險。但還是開始吧。

美國應該做的第一件事——務必將此作為與中國達成更廣泛協議的談判籌碼——是讓包括華為在內的中國公司在台積電製造晶片,並進一步讓中國公司購買頂級的 Nvidia 晶片。

關於華為的部分很直接:華為創始人可能告訴過中國國家主席習近平,華為不需要外部晶片製造商,但我認為,一旦能接觸到台積電尖端的代工技術,華為展現出的偏好將是追求比從中芯國際能獲得的更好的晶片——而且這種差距只會越來越大。當然,華為仍會與中芯國際合作,但產量會下降;關鍵是,那種「別無選擇」的緊迫感也會隨之降低。延伸開來,這將重啟中國對台積電的依賴,從而增加對台灣採取行動的成本。

與此同時,讓華為接觸到尖端晶片將對 Nvidia 的主導地位構成重大威脅;該公司之所以對晶片禁令如此憤怒,不僅是因為損失的收入,更是因為這迫使對方開發出 CUDA 生態系統的替代方案。中和這一挑戰的最佳方式——而讓 Nvidia 掌控局勢而非華為,符合美國的利益——就是給予字節跳動、阿里巴巴和 DeepSeek 購買最好產品的機會。

這毫無疑問會釋放中國在 AI 方面的力量;防止這一點正是拜登政府各類晶片禁令的核心目的。然而,DeepSeek 的成功應該迫使人們重新評估:完全切斷中國與 AI 的聯繫究竟有多可行。

同樣值得注意的是,成功阻止中國的 AI 努力也有其風險:中國之所以遲遲不對台灣採取行動,另一個原因是他們知道,每等待一年,他們在上述所有現實世界中的相對優勢就會增加;這使得等待變得更加審慎。然而,如果美國開發出在軍事背景下至關重要的 AI,而中國卻被切斷聯繫,這種考量就會改變:現在審慎的做法是宜早不宜遲,特別是如果美國依賴台灣來獲取製造那些 AI 所需的晶片。

雖然我一直提到「晶片禁令」,但這其實是不完整的:美國還採取行動限制中國獲得製造領先製程晶片所需的半導體設備(例如,中芯國際的 7 奈米製程幾乎完全依賴西方的半導體設備)。遺憾的是,由於中國是美國半導體設備製造商的大市場,由此產生的慷慨漏洞使得這項努力大多以失敗告終。

是時候堵住這些漏洞了;記住,首要目標是讓中國增加對台灣的依賴,這意味著要切斷中芯國際和中國其他代工廠的後路。是的,這增加了中國開發出西方半導體製造商替代方案的風險,導致長期競爭和研發資金減少,但現在是做出艱難選擇的時候,增加台灣對中國的重要性更為重要。

美國在成熟製程晶片產能上對台積電的依賴仍是一個巨大問題;如果你覺得 COVID 期間的晶片短缺很糟糕,那麼美國只剩下 GlobalFoundries 而別無他選的情境,將是一場難以想像的災難。然而,只要台積電存在,就沒有任何經濟理由讓任何人去建造更多的成熟製程晶圓廠。

因此,這是一個政府補貼作為答案的教科書案例:國家安全需要成熟製程產能,而市場缺乏建造它的經濟動力。而且,作為額外獎勵,這有助於彌補那些現在被完全切斷與中國聯繫的半導體製造商的部分收入。台積電當然會受到打擊,但他們也得到了華為和其他中國晶片製造商訂單的支撐。

這留下了 Intel 以及對本土領先製程產能的需求,這在某些方面是最難解決的問題。

第一,美國應該策劃將 Intel 的 x86 晶片業務以名義價格分拆給博通或高通;接收公司的真實成本將是保證不僅訂購 Intel 晶片,還要將其現有晶片的大部分交由 Intel 代工(Intel Foundry)生產。這將為 Intel 代工提供起步所需的基礎客戶。

第二,美國應該提議補貼在 Intel 代工製造的 Nvidia 晶片。是的,這是一個價值數十億美元的提議,但這是讓美國 AI 產業紮根於美國晶圓廠的最短、最快路徑。

第三,如果 Nvidia 拒絕——考慮到更換代工廠的風險,他們很可能會拒絕——那麼美國應該大量訂購 Intel Gaudi AI 加速器,建造數據中心來安置它們,並將其免費提供給想要建立自己 AI 模型的公司和新創企業,前提是所有成果必須開源。

第四,美國應該大力補貼晶片新創公司在 Intel 代工進行生產,前提是開發出的所有用於實際製造晶片的 IP——那些與晶片本身「秘密配方」分開的基礎構建模組——必須開源。

第五,美國應該為所有在美國製造的晶片上創建的模型提供版權侵權擔保,前提是用於訓練模型的數據必須免費公開。

這是美國想要達到的未來狀態:一個運行在美國製造晶片上的強大 AI 產業,以及中國無法觸及的成熟製程產能。然而,要達到這個目標,需要對市場進行重大干預,以消除美國公司單純依賴台積電的壓倒性動力;即便如此,這種轉變也需要時間,這就是為什麼在此期間,讓台灣成為中國科技產業不可或缺的一部分,是必須付出的代價。

AI 正處於一個令人興奮的階段,但也非常脆弱。我相信這個計劃,儘管包含所有風險和犧牲,是確保所有正在萌芽的樹木有時間真正紮根並改變世界的最佳方式。

我在這篇《每日更新》中寫了本文的後續。


  1. 這暗示了一個令人驚訝的啟示:雖然 ChatGPT 尤其是 Claude 上的 RLHF 封鎖了 4chan 元素,但它們可能也壓制了 Tumblr 元素,也就是說政治傾向並非來自訓練後處理,而是來自數據集——即網際網路。換句話說,如果我對 Grok 3 的 RLHF 層較薄的判斷是正確的,那就能解釋其表面的政治傾向以及隱藏在底層的內容。 ↩
  2. Grok 目前還沒有 Mac 應用程式,但它的 iPhone 應用程式非常好。 ↩
  3. 儘管 Nvidia 的第一款晶片是由意法半導體(SGS-Thomson Microelectronics)製造的。 ↩

分享

相關內容

Stratechery Plus
更新

John Collison 在 Cheeky Pint 播客對 Ben Thompson 的專訪

Spotify 財報、個人化網絡、AI 與聚合

亞馬遜財報、資本支出疑慮、商品化 AI

Stratechery Plus
播客

Image

Image

Image

Stratechery Plus
訪談

John Collison 在 Cheeky Pint 播客對 Ben Thompson 的專訪

與 Benedict Evans 談 AI 與軟體

與 Kalshi 執行長 Tarek Mansour 談預測市場

Sharp Text
文章

Stratechery 歷年最受歡迎且最重要的文章。

探索 Stratechery 的所有免費文章。

探索 Stratechery 的所有文章。

Stratechery Plus
更新

John Collison 在 Cheeky Pint 播客對 Ben Thompson 的專訪

Spotify 財報、個人化網絡、AI 與聚合

亞馬遜財報、資本支出疑慮、商品化 AI

Stratechery Plus
播客

Image

Image

Image

Stratechery Plus
訪談

John Collison 在 Cheeky Pint 播客對 Ben Thompson 的專訪

與 Benedict Evans 談 AI 與軟體

與 Kalshi 執行長 Tarek Mansour 談預測市場

© Stratechery LLC 2026 | 服務條款 | 隱私政策

由 WordPress 設計。由 Pressable 託管。

stratechery

相關文章

  1. AI的承諾與晶片的脆弱性

    大約 1 年前

  2. 大 AI 晶片荒

    newsletter.semianalysis.com · 26 天前

  3. AI 第 157 期:破釜沉舟

    Lesswrong · 大約 2 個月前

  4. Anthropic 指控中國 AI 實驗室在美國辯論晶片出口管制之際竊取 Claude 數據

    Techcrunch · 大約 2 個月前

  5. AI #152:由「折磨連結」帶來

    Lesswrong · 3 個月前