神話、靈感與算力的機會成本
聚合理論在算力受限的世界中是否依然存在?是的,只要控制需求就能掌握供應。本文探討 AI 時代下技術成本結構的轉變,以及超大規模雲端業者如何應對從邊際成本向機會成本的轉移。
聚合理論(Aggregation Theory)在算力受限的世界中還能生存嗎?是的,因為控制需求將賦予控制供應的權力。
2025 年 1 月,Fabricated Knowledge 的 Doug O’Laughlin 宣稱,o1 和推理模型的出現標誌著聚合理論的終結:
我相信,除了經濟因素外,模型的改進沒有實際限制,我認為這將是未來的真正約束。如果我們在一個模型上投入無限的資金,它理所當然會得到改進。問題在於,投入無限資金對一家企業來說是否有意義。
這將是 2025 年的關鍵問題。AI 的經濟模式如何運作?關於互聯網的核心假設之一剛剛被打破。邊際成本現在再次存在,這意味著大多數超大規模業者(hyperscalers)將變得越來越資本密集。
聚合理論的時代已經過去,AI 再次讓技術變得昂貴。這種因消費增加而導致成本增加的關係,是反互聯網時代的思維。這將是今年需要面對的大問題。超大規模業者的商業模式主要建立在邊際成本為零的基礎上。因此,只要你建立好基礎設施,並在一個互聯網規模的產品中填滿用戶,你就能賺錢。
這個時代很快就會結束,未來將會更加怪異且更加耗費算力。回顧 2010 年代,我們可能會認為那是技術長河中一個天真的時期。我們對這段時期的一個基本假設正在瓦解。這將是未來技術格局中單一最重大的變化。
如果我可以自誇的話,聚合理論是理解 2010 年代(特別是消費科技領域)單一最好的方式。它解釋了支撐 Google 和 Facebook 主導地位的動態,以及 App Store 和亞馬遜電子商務業務的邏輯;它也是一個有用的(儘管不完整)框架,用來理解包括 Uber、Airbnb 和 Netflix 在內的一系列消費服務。
然而,值得指出的是,支撐聚合理論的一些關鍵見解要古老得多,並植根於技術本身的根本性質。正如 O’Laughlin 所指出的,它們植根於零邊際成本的概念。
邊際成本
邊際成本是指多生產一個單位的商品需要多少成本。考慮一個製造小零件(widget)的工廠:
- 你需要工廠用地
- 你需要工廠機器
- 你需要電力來運行機器
- 你需要人力來操作機器
- 你需要生產零件的原材料
土地和機器顯然是固定成本;你必須擁有這兩者才能開始,無論你是否多生產一個零件,你都在為這兩者付費。另一方面,原材料顯然是邊際成本:如果你多做一個零件,你就需要多一份零件的原材料。在實體商品方面,電力和人力也是邊際成本:你需要更多或更少的人力電力,取決於你生產零件的多寡。
邊際成本之所以重要,是因為它們提供了價格底線。公司會虧損經營,是因為損益是一個包含折舊(即固定成本)的會計概念。例如,假設一家公司花了 1,000 美元蓋工廠來生產邊際成本為 10 美元的零件:只要零件價格高於 10 美元,公司就會繼續生產,即使賺的錢不足以支付折舊成本(即會計上虧損),因為至少他們在每個零件上仍賺取邊際利潤(公司可能不會做的是投資更多固定成本,且最終可能會因為支撐這些固定成本的債務利息而破產)。
我之所以精確地解釋這一切,是因為這對科技業來說幾乎完全無關緊要。首先,通常沒有原材料成本,因為產出是數位的。其次,因為沒有原材料成本,且固定成本如此巨大,電力和人力通常被視為固定成本而非邊際成本:你當然會讓服務器全天候滿載運行,因為你能產生的每一分額外收入都是值得的。
AI 非常符合這種範式:產出是數位的,雖然 AI 芯片消耗大量電力,但其成本僅佔芯片本身成本的一小部分,也就是說,擁有 AI 芯片的人不會根據利用率來計算邊際成本。它們一定會被使用!相反,真正重要的決定是它們將被用於何處。
機會成本
考慮微軟:上個季度,該公司未達到市場對 Azure 增長的預期,並非因為沒有需求,而是因為公司決定將產能用於自家產品。財務長 Amy Hood 在公司財報電話會議上表示:
我認為最好將我們提供的 Azure 指引視為一個分配產能指引,即我們在 Azure 營收中能交付的內容。因為當我們投入資本,特別是 GPU(也適用於 CPU,但 GPU 更具體)時,我們實際上是在做長期決策。我們做的第一件事是解決 M365 Copilot 以及 GitHub Copilot(我們的第一方應用)日益增長的使用量和加速的銷售步伐。然後我們確保投資於研發和產品創新的長期性質。我認為你們最近看到的我們在產品上的許多加速,是因為我們正將 GPU 和產能分配給我們過去幾年聘請的許多優秀 AI 人才。
最後剩下的部分,才會用於服務需求持續增長的 Azure 產能。有一種思考方式——因為我有時會被問到這個問題——如果我將第一季和第二季剛上線的所有 GPU 全部分配給 Azure,KPI 將會超過 40。我認為最重要的一點是,這是關於投資於所有能讓客戶受益的堆棧層級。我希望這對思考資本增長有所幫助,它體現在每一個部分,體現在整個業務的營收增長中,也體現在我們投資於人才時的營運支出(OpEx)增長中。
微軟在這裡應對的成本不是邊際成本,而是機會成本:花在一個領域的算力就不能用於另一個領域;在這次財報中,微軟承認如果他們願意,他們本可以達成 Azure 的目標數字,但他們選擇優先處理自家的工作負載,因為正如執行長 Satya Nadella 稍後在電話會議中指出的,這些產品具有更高的毛利率概況和更高的終身價值。
超大規模業者面臨的挑戰是機會成本,而非邊際成本。應該分配多少算力給客戶?給哪些客戶?應該保留多少用於內部工作負載?微軟需要平衡 Azure(包括其企業客戶和 OpenAI)與其軟體業務;亞馬遜需要平衡其電子商務業務、AWS,以及對 Anthropic 和 OpenAI 的戰略投資。Google 則必須平衡 GCP、其對 Anthropic 的戰略投資以及其消費業務。
Mythos
上週,Anthropic 發布了其最先進的模型 Mythos。而且,以某種典型的 Anthropic 方式,它通過關注其危險性來進行發布;摘自 Project Glasswing(該公司利用 Mythos 應對安全問題的倡議)的介紹文章:
我們成立 Project Glasswing 是因為我們在 Anthropic 訓練的一個新前沿模型中觀察到了某些能力,我們相信這些能力可能會重塑網絡安全。Claude Mythos Preview 是一個通用、尚未發布的前沿模型,它揭示了一個嚴峻的事實:AI 模型的編碼能力已達到一個水平,在發現和利用軟體漏洞方面,它們可以超越除了最熟練的人類之外的所有人。
Mythos Preview 已經發現了數千個高嚴重性漏洞,其中包括每個主要操作系統和網頁瀏覽器中的漏洞。鑑於 AI 進步的速度,這些能力很快就會擴散,甚至可能超出那些致力於安全部署的參與者。這對經濟、公共安全和國家安全的後果可能是嚴重的。Project Glasswing 是一次緊急嘗試,旨在將這些能力用於防禦目的。
在上週的一篇更新中,我將 Anthropic 這種「災難色情式行銷」比作放羊的孩子;這個類比的重要之處不僅在於那個孩子發出了虛假警報,還在於最終狼真的來了。為此,我在兩週前寫過關於支撐所有軟體的無數安全問題,以及我對 AI 長期解決這些問題的樂觀態度,即使它在短期內會讓事情變得更糟。換句話說,Mythos 是否代表重大安全威脅其實並不重要:如果這個模型不是,未來的模型也會是;因此,我確實支持利用 Mythos 主動發現並修復漏洞,以免被惡意行為者發現並利用。
與此同時,值得注意的是,Anthropic 不廣泛開放 Mythos 還有其他原因,即將訪問權限限制在少數具有高能力和高付費意願的公司。首先是那些機會成本:Anthropic 的算力在服務現有模型時已經捉襟見肘;上週末 X(原 Twitter)上充斥著投訴和辯論,稱 Anthropic 在過去一個月左右疑似降低了 Claude 的智商。讓 Mythos 更廣泛地可用——特別是對於不按使用量付費的訂閱方案——會讓情況變得更糟。
換句話說,Anthropic 面臨的不是邊際成本問題,而是機會成本問題:如何分配其算力。當然,這可能會演變成利潤率問題:我懷疑 Anthropic 將通過從超大規模業者和新興雲端服務商(neoclouds)那裡獲取更多算力,並為此支付高昂代價,來克服其在算力方面的保守主義。
處理這些成本的關鍵將是未來對 Claude 收取更高費用;延伸開來,這意味著要維持定價權,這引出了不廣泛發布 Mythos 的第二個好處。Anthropic 當然面臨來自 OpenAI 的競爭;然而,對於這兩家前沿實驗室來說,長期的真正競爭對手是開源模型。目前這些模型主要來自中國,而快速跟進前沿模型的關鍵要素是「蒸餾」(distillation);摘自 Anthropic 的部落格:
我們發現了三個 AI 實驗室——DeepSeek、月之暗面(Moonshot)和 MiniMax——進行的工業級規模活動,旨在非法提取 Claude 的能力以改進他們自己的模型。這些實驗室通過約 24,000 個欺詐帳戶與 Claude 進行了超過 1,600 萬次交流,違反了我們的服務條款和區域訪問限制。
這些實驗室使用了一種稱為「蒸餾」的技術,即在更強大模型的輸出上訓練一個能力較弱的模型。蒸餾是一種廣泛使用且合法的訓練方法。例如,前沿 AI 實驗室經常蒸餾自己的模型,為客戶創建更小、更便宜的版本。但蒸餾也可以用於非法目的:競爭對手可以利用它,以獨立開發所需時間和成本的一小部分,從其他實驗室獲取強大的能力。
我絕對相信這是一個真實的問題,並且在去年 DeepSeek R1 發布時也寫過類似的觀點。我也認為,除了前沿實驗室之外,所有人的利益都在於假裝這不是問題;開源模型不受前沿實驗室溢價或算力約束的限制,這正是為什麼大多數公司都能從中受益,無論它們是否經過蒸餾。當然,這並不意味著它們可以免費運行:你仍然需要提供算力。
然而,請注意,這使得停止蒸餾成為前沿實驗室更優先的任務:首先,他們想保護自己的利潤率。其次,他們最大的成本是機會成本:那些因為算力不足而無法服務的客戶。他們能在多大程度上降低算力對潛在客戶的效用(通過阻止開源模型蒸餾他們的模型),他們就能在多大程度上以更有利的價格為自己獲取這些算力。
Meta Muse
Mythos 並不是上週宣布的唯一新模型:Meta 也發布了其新前沿實驗室的第一個成果。摘自該公司的部落格文章:
今天,我們很高興推出 Muse Spark,這是由 Meta 超級智能實驗室(Meta Superintelligence Labs)開發的 Muse 系列模型中的第一個。Muse Spark 是一個原生多模態推理模型,支持工具使用、視覺思維鏈和多智能體編排。
Muse Spark 是我們擴展階梯的第一步,也是我們從底層徹底改革 AI 努力的第一個產品。為了支持進一步擴展,我們正在整個堆棧進行戰略投資——從研究和模型訓練到基礎設施,包括 Hyperion 數據中心……
Muse Spark 在多模態感知、推理、健康和智能體任務方面提供了具競爭力的表現。我們將繼續投資於目前存在性能差距的領域,例如長跨度智能體系統和編碼工作流。
Muse Spark 雖然不是頂尖水平(state of the art),但它已進入賽場,總體而言是 Meta 超級智能實驗室給人的積極第一印象。然而,對我來說最值得注意的是,過去九個月的 AI 發展清楚地表明,執行長 Mark Zuckerberg 決定對 Meta 的 AI 努力進行「從底層徹底改革」是正確的決定。
引發我文章開頭提到的 O’Laughlin 貼文的誘因是「推理」,即模型使用更多 token 會產生更好的答案;從那以後,智能體(agents)呈指數級增加了 token 需求,因為它們可以在沒有人類參與的情況下持續使用 LLM。這是 Claude 以及 OpenAI 的 Codex 需求飆升的巨大驅動力。此外,這個用例的潛在利潤如此之高,以至於不僅 Anthropic 的營收在飆升,OpenAI 也正將重心轉向企業端。
事實上,你可以辯論說 OpenAI 最大的挑戰之一在於它擁有 ChatGPT 這樣一個受歡迎的消費級產品。我一直以聚合理論的視角認為,用戶群是 OpenAI 的巨大優勢,但那是假設公司能有效地將其變現,這也是為什麼我如此強烈地主張廣告模式。OpenAI 對此有宏大的預測,但在那實現之前,龐大的消費用戶群在 OpenAI 的專注力和算力方面是一個巨大的機會成本。該公司在廣泛的質疑聲中,確實對更多算力進行了重大投資,這值得稱讚,但將越來越多的算力分配給企業願意付費的智能體用例(即使以犧牲消費業務為代價)的誘惑力將會非常大。
這使得 Meta 相對於行業內其他公司處於獨特地位:與任何超大規模業者或前沿實驗室不同,Meta 沒有企業或雲端業務需要擔心。這意味著服務消費市場不會帶來機會成本。當然,考慮到 Meta 已經擁有成熟的廣告業務來將使用量變現,這些機會成本本來就會小得多。換句話說,Meta 在贏得消費市場方面面臨的競爭實際上可能比幾個月前看起來要小,僅僅是因為那是他們的主要焦點——而且因為他們擁有自己的模型,這意味著他們不需要擔心無法訪問前沿實驗室(當然,這套分析很大程度上也適用於 Google)。
同樣的道理,這也是為什麼 Meta 應該像對待 Llama 一樣開源 Muse。受前沿模型廣泛可用傷害最深的是其他前沿實驗室,他們的定價權將被削弱,並面臨更激烈的算力競爭。這將使他們更難承擔追求消費市場的機會成本,從而將其留給 Meta。
需求 vs. 供應
那麼,「聚合理論的時代……已經過去」了嗎?一方面,通過擁有客戶來創造和維持價值的洞察,幾乎肯定會繼續成立。在消費端,擁有客戶會帶來廣告,從而提供為客戶提供服務所需的收入。在企業端——我要指出,這從來不是聚合理論適用的領域——我認為 Anthropic 和 OpenAI 很可能會繼續向堆棧上方移動,並提供直接與軟體供應商競爭的功能(這種做法也符合不公開領先模型的策略)。
另一方面,O’Laughlin 觀察到我們現在和未來都將受到算力約束,這是一個重要的觀點:公司將無法假設他們可以服務所有人,因為服務一組客戶就意味著不服務另一組客戶的機會成本。至少在理論上,這不會永遠持續下去:在某個時點,AI 對於足夠多的用例來說將「足夠好」,屆時將有足夠的算力容量來利用服務 AI 確實沒有實質邊際成本這一事實;然而,那個理論上的未來感覺比以往任何時候都更加遙遠。
OpenAI 押注這種算力約束——以及他們為克服它而達成的交易——將比 Anthropic 目前在終端用戶中的勢頭更重要。摘自 Bloomberg:
OpenAI 本週告訴投資者,其大幅增加計算資源的早期推動,使其在長期競爭對手 Anthropic PBC 取得進展並考慮潛在 IPO 之際,擁有了關鍵優勢。
根據該公司在 Anthropic 發布名為 Mythos 的更強大 AI 模型後發給部分投資者的備忘錄,這家 ChatGPT 製造商表示,它通過「快速且持續地」增加計算能力來支持其軟體的更廣泛採用,從而超越了 Anthropic。備忘錄指出,這種雄心勃勃的基礎設施建設雖然被一些人批評為成本過高,但使 OpenAI 能夠更好地跟上對 AI 產品日益增長的需求。
我不太確定這是否具有決定性。當涉及到 AI 時,分銷和交易成本仍然是免費的——這是聚合者的兩個前提條件——這意味著贏家應該是那些擁有最引人入勝產品的人。這些產品將贏得最多的用戶,提供獲取算力以服務他們所需的資金;考慮 Anthropic 確保了很大一部分 TPU 供應的交易,鑑於台積電的產能限制,這最終是從 Google 手中奪取供應的一個例子。我懷疑 Anthropic 可以獲取更多,包括已經建成的超大規模業者和新興雲端產能。是的,那些算力會更貴,但如果需求足夠高,必要的現金流就會在那裡。
換句話說,我的賭注是,擁有需求最終將勝過擁有供應,這表明聚合理論的底層原則依然存在。換種說法,我認為 OpenAI 需要依靠更好的產品獲勝,而不僅僅是更多的算力;但話又說回來,如果更多算力是更好產品的關鍵,那麼供應是否最重要?無論如何,他們肯定會專注於為那些推動 Anthropic 驚人增長的企業客戶提供這兩者。真正的代價可能是他們目前主導的消費市場,因為 Meta 在那裡沒什麼可失去的,卻有一切可以贏得。
添加到您的播客播放器:Stratechery | Sharp Tech | Dithering | Sharp China | GOAT | Asianometry