
本週稍早,觸及 AI 供應鏈各個層級的五位人士在比佛利山莊舉行的米爾肯全球會議上坐下來,與 TechCrunch 編輯暢談從晶片短缺、軌道數據中心到支撐該技術的整個架構可能出錯等各種議題。
本週稍早,五位觸及 AI 供應鏈各個層級的關鍵人物齊聚比佛利山莊的米爾肯全球會議(Milken Global Conference)。他們與本刊編輯坐下來,深入探討了從晶片短缺、軌道數據中心,到支撐這項技術的整個架構可能存在錯誤等各項議題。
與 TechCrunch 同台的嘉賓包括:ASML 執行長 Christophe Fouquet,這家荷蘭公司壟斷了極紫外光(EUV)微影設備,沒有它,現代晶片就無法存在;Google Cloud 營運長 Francis deSouza,他正監督著企業史上規模最大的基礎設施投資之一;Applied Intuition 共同創辦人暨執行長 Qasar Younis,這是一家估值 150 億美元的實體 AI 公司,從模擬起家並已進軍國防領域;Perplexity 首席商務官 Dimitry Shevelenko,這是一家原生於 AI 的「從搜尋到代理人」公司;以及量子物理學家 Eve Bodnia,她離開學術界創辦了 Logical Intelligence,旨在挑戰大多數 AI 產業視為理所當然的基礎架構。(Meta 前首席 AI 科學家 Yann LeCun 已於今年早些時候簽約擔任該新創公司技術研究委員會的創始主席。)
以下是他們的觀點:
AI 熱潮正撞上嚴峻的物理極限,而這些限制的起始點比許多人想像的還要深。Fouquet 首先指出,雖然晶片製造正在「大幅加速」,但他「堅信」儘管付出了所有努力,「在未來兩年、三年,甚至五年內,市場仍將受限於供應」。這意味著超大規模業者——Google、微軟、亞馬遜、Meta——將無法獲得他們付錢預訂的所有晶片,這是不爭的事實。
DeSouza 強調了這個問題的規模與增長速度,他提醒觀眾,Google Cloud 的營收在上季突破了 200 億美元,增長了 63%,而其積壓訂單(已承諾但尚未交付的營收)在單季內幾乎翻倍,從 2500 億美元增至 4600 億美元。「需求是真實的,」他以令人印象深刻的冷靜說道。
對 Younis 來說,限制主要來自其他地方。Applied Intuition 為汽車、卡車、無人機、採礦設備和國防車輛構建自主系統,他的瓶頸不是矽片,而是只能透過將機器送入現實世界並觀察發生了什麼才能收集到的數據。「你必須從現實世界中尋找它,」他說,再多的合成模擬也無法完全彌補這一差距。「在你能完全透過合成方式訓練出運行在物理世界的模型之前,還有很長的路要走。」
如果晶片是第一個瓶頸,能源就是緊隨其後的隱憂。DeSouza 證實,Google 正在探索將數據中心設在太空,作為應對能源限制的嚴肅方案。「在那裡你可以獲得更充足的能源,」他指出。當然,即使在軌道上也不簡單。DeSouza 觀察到太空是真空環境,因此消除了對流,使得輻射成為向周圍環境散熱的唯一途徑(這比數據中心目前依賴的空氣和液體冷卻系統要慢得多,且工程難度更高)。但該公司仍將其視為一條可行的路徑。
DeSouza 提出的一個更深層的論點(意料之中)是關於透過整合實現效率。他暗示,Google 協同開發其完整 AI 堆疊的策略——從自定義 TPU 晶片到模型和代理人——在每瓦算力(watts per flop)方面帶來的回報,是購買現成組件的公司無法複製的。「在 TPU 上運行 Gemini 比任何其他配置都更節能,」他說,因為晶片設計師在模型發布前就知道其需求。在能源供應成為技術發展巨大限制的世界裡,這種垂直整合是一項重大的競爭優勢。
Fouquet 在隨後的討論中呼應了這一點。「沒有什麼是可以不計代價的,」他說。產業目前正處於一個奇特的時刻,在戰略必要性的驅動下投入了驚人的資本。但更多的計算意味著更多的能源,而更多的能源是有代價的。
當產業的其他部分還在大型語言模型(LLM)範式內爭論規模、架構和推理效率時,Eve Bodnia 正在構建完全不同的東西。
她的公司 Logical Intelligence 建立在所謂的能量模型(Energy-Based Models, EBMs)之上。這類 AI 不預測序列中的下一個標記(token),而是試圖理解數據背後的規則,她認為這種方式更接近人類大腦的實際運作方式。「語言是我大腦與你大腦之間的用戶界面,」她說。「推理本身並不依附於任何語言。」
她最大的模型運行參數為 2 億個——相比之下,領先的 LLM 動輒數千億個——且她聲稱其運行速度快上數千倍。更重要的是,它的設計旨在隨著數據變化而更新知識,而不是需要從頭開始重新訓練。
對於晶片設計、機器人技術和其他需要系統掌握物理規則而非語言模式的領域,她認為 EBM 是更自然的選擇。「當你開車時,你不是在任何語言中尋找模式。你觀察周圍,理解關於周圍世界的規則,然後做出決定。」這是一個有趣的論點,鑑於 AI 領域開始質疑單靠規模是否足夠,這在未來幾個月可能會吸引更多關注。
Shevelenko 在對話中花了大量時間解釋 Perplexity 如何從搜尋產品演變為現在所謂的「數位員工」。其最新產品 Perplexity Computer 的設計初衷不是作為知識工作者使用的工具,而是作為知識工作者指揮的部屬。「每天醒來,你的團隊中就有 100 名員工,」他在談到這個機會時說。「你會做什麼來充分利用它?」
這是一個極具吸引力的推銷;但也引發了關於控制權的顯而易見的問題。他的答案是「細粒度」(granularity)。企業管理員不僅可以指定代理人可以訪問哪些連接器和工具,還可以指定這些權限是唯讀還是可讀寫——當代理人在企業系統內部執行操作時,這一區別至關重要。當 Perplexity 的電腦操作代理人 Comet 代表用戶採取行動時,它會先展示計劃並徵求批准。Shevelenko 說,有些用戶覺得這種摩擦很煩人,但他認為這是必不可少的,特別是在加入 Lazard 董事會後,他發現自己意外地同情首席資訊安全官(CISO)的保守本能,因為他們保護的是一個完全建立在客戶信任之上的 180 年品牌。「細粒度是良好安全習慣的基石,」他說。
Younis 提出了可能是小組討論中最具地緣政治色彩的觀察:實體 AI 與國家主權的糾纏方式是純數位 AI 從未有過的。
互聯網最初作為美國技術傳播,僅在應用層(如 Uber 和 DoorDash)面臨抵制,因為那時線下後果變得顯而易見。實體 AI 則不同。自動駕駛汽車、國防無人機、採礦設備、農業機器——這些在現實世界中的呈現方式是政府無法忽視的,引發了關於安全、數據收集以及誰最終控制在國境內運行的系統的問題。「幾乎所有國家都一致表示:我們不希望這種實體形式的智能出現在我們的國境內,並由另一個國家控制。」他告訴觀眾,目前能部署自動駕駛計程車(robotaxi)的國家比擁有核武器的國家還要少。
Fouquet 的切入點略有不同。中國的 AI 進步是真實的——今年早些時候 DeepSeek 的發布讓產業部分領域陷入恐慌——但這種進步在模型層以下受到了限制。如果無法獲得 EUV 微影技術,中國晶片製造商就無法生產最先進的半導體,而建立在舊硬體上的模型,無論軟體多好,都會在競爭中處於劣勢。「今天,在美國,你有數據、有計算資源、有晶片、有專業人才。中國在堆疊的最頂層做得非常好,但缺乏底層的一些元素,」Fouquet 說。
在小組討論接近尾聲時,觀眾席中有人提出了一個顯而易見且令人不安的問題:這一切是否會影響下一代批判性思考的能力?
嘉賓們的回答(或許並不令人意外)是樂觀的,儘管並非盲目樂觀。DeSouza 指出,更強大的工具可能最終讓人類解決更大規模的問題。想想那些我們尚未理解其生物機制的的神經系統疾病、溫室氣體移除,以及被推遲了數十年的電網基礎設施。「這應該能將我們釋放到更高層次的創造力,」他說。
Shevelenko 提出了一個更務實的觀點:初級職位(entry-level job)可能正在消失,但獨立啟動事業的能力從未像現在這樣唾手可得。「對於任何擁有 Perplexity Computer 的人來說……限制在於你自己的好奇心和行動力。」
Younis 則對知識工作和體力勞動做了最鮮明的區分。他指出,美國農民的平均年齡是 58 歲,而採礦、長途貨運和農業領域的勞動力短缺是長期且日益嚴重的——這不是因為工資太低,而是因為人們不想做那些工作。在這些領域,實體 AI 並非在取代願意的勞動者,而是在填補一個已經存在且看起來只會進一步加深的真空。
相關文章
其他收藏 · 0