神話、靈感與算力的機會成本

stratechery·大約 3 小時前

聚合理論在算力受限的世界中是否依然存在？是的，只要控制需求就能掌握供應。本文探討 AI 時代下技術成本結構的轉變，以及超大規模雲端業者如何應對從邊際成本向機會成本的轉移。

聚合理論（Aggregation Theory）在算力受限的世界中還能生存嗎？是的，因為控制需求將賦予控制供應的權力。

2025 年 1 月，Fabricated Knowledge 的 Doug O’Laughlin 宣稱，o1 和推理模型的出現標誌著聚合理論的終結：

我相信，除了經濟因素外，模型的改進沒有實際限制，我認為這將是未來的真正約束。如果我們在一個模型上投入無限的資金，它理所當然會得到改進。問題在於，投入無限資金對一家企業來說是否有意義。

這將是 2025 年的關鍵問題。AI 的經濟模式如何運作？關於互聯網的核心假設之一剛剛被打破。邊際成本現在再次存在，這意味著大多數超大規模業者（hyperscalers）將變得越來越資本密集。

聚合理論的時代已經過去，AI 再次讓技術變得昂貴。這種因消費增加而導致成本增加的關係，是反互聯網時代的思維。這將是今年需要面對的大問題。超大規模業者的商業模式主要建立在邊際成本為零的基礎上。因此，只要你建立好基礎設施，並在一個互聯網規模的產品中填滿用戶，你就能賺錢。

這個時代很快就會結束，未來將會更加怪異且更加耗費算力。回顧 2010 年代，我們可能會認為那是技術長河中一個天真的時期。我們對這段時期的一個基本假設正在瓦解。這將是未來技術格局中單一最重大的變化。

如果我可以自誇的話，聚合理論是理解 2010 年代（特別是消費科技領域）單一最好的方式。它解釋了支撐 Google 和 Facebook 主導地位的動態，以及 App Store 和亞馬遜電子商務業務的邏輯；它也是一個有用的（儘管不完整）框架，用來理解包括 Uber、Airbnb 和 Netflix 在內的一系列消費服務。

然而，值得指出的是，支撐聚合理論的一些關鍵見解要古老得多，並植根於技術本身的根本性質。正如 O’Laughlin 所指出的，它們植根於零邊際成本的概念。

邊際成本

邊際成本是指多生產一個單位的商品需要多少成本。考慮一個製造小零件（widget）的工廠：

你需要工廠用地
你需要工廠機器
你需要電力來運行機器
你需要人力來操作機器
你需要生產零件的原材料

土地和機器顯然是固定成本；你必須擁有這兩者才能開始，無論你是否多生產一個零件，你都在為這兩者付費。另一方面，原材料顯然是邊際成本：如果你多做一個零件，你就需要多一份零件的原材料。在實體商品方面，電力和人力也是邊際成本：你需要更多或更少的人力電力，取決於你生產零件的多寡。

邊際成本之所以重要，是因為它們提供了價格底線。公司會虧損經營，是因為損益是一個包含折舊（即固定成本）的會計概念。例如，假設一家公司花了 1,000 美元蓋工廠來生產邊際成本為 10 美元的零件：只要零件價格高於 10 美元，公司就會繼續生產，即使賺的錢不足以支付折舊成本（即會計上虧損），因為至少他們在每個零件上仍賺取邊際利潤（公司可能不會做的是投資更多固定成本，且最終可能會因為支撐這些固定成本的債務利息而破產）。

我之所以精確地解釋這一切，是因為這對科技業來說幾乎完全無關緊要。首先，通常沒有原材料成本，因為產出是數位的。其次，因為沒有原材料成本，且固定成本如此巨大，電力和人力通常被視為固定成本而非邊際成本：你當然會讓服務器全天候滿載運行，因為你能產生的每一分額外收入都是值得的。

AI 非常符合這種範式：產出是數位的，雖然 AI 芯片消耗大量電力，但其成本僅佔芯片本身成本的一小部分，也就是說，擁有 AI 芯片的人不會根據利用率來計算邊際成本。它們一定會被使用！相反，真正重要的決定是它們將被用於何處。

機會成本

考慮微軟：上個季度，該公司未達到市場對 Azure 增長的預期，並非因為沒有需求，而是因為公司決定將產能用於自家產品。財務長 Amy Hood 在公司財報電話會議上表示：

我認為最好將我們提供的 Azure 指引視為一個分配產能指引，即我們在 Azure 營收中能交付的內容。因為當我們投入資本，特別是 GPU（也適用於 CPU，但 GPU 更具體）時，我們實際上是在做長期決策。我們做的第一件事是解決 M365 Copilot 以及 GitHub Copilot（我們的第一方應用）日益增長的使用量和加速的銷售步伐。然後我們確保投資於研發和產品創新的長期性質。我認為你們最近看到的我們在產品上的許多加速，是因為我們正將 GPU 和產能分配給我們過去幾年聘請的許多優秀 AI 人才。

最後剩下的部分，才會用於服務需求持續增長的 Azure 產能。有一種思考方式——因為我有時會被問到這個問題——如果我將第一季和第二季剛上線的所有 GPU 全部分配給 Azure，KPI 將會超過 40。我認為最重要的一點是，這是關於投資於所有能讓客戶受益的堆棧層級。我希望這對思考資本增長有所幫助，它體現在每一個部分，體現在整個業務的營收增長中，也體現在我們投資於人才時的營運支出（OpEx）增長中。

微軟在這裡應對的成本不是邊際成本，而是機會成本：花在一個領域的算力就不能用於另一個領域；在這次財報中，微軟承認如果他們願意，他們本可以達成 Azure 的目標數字，但他們選擇優先處理自家的工作負載，因為正如執行長 Satya Nadella 稍後在電話會議中指出的，這些產品具有更高的毛利率概況和更高的終身價值。

超大規模業者面臨的挑戰是機會成本，而非邊際成本。應該分配多少算力給客戶？給哪些客戶？應該保留多少用於內部工作負載？微軟需要平衡 Azure（包括其企業客戶和 OpenAI）與其軟體業務；亞馬遜需要平衡其電子商務業務、AWS，以及對 Anthropic 和 OpenAI 的戰略投資。Google 則必須平衡 GCP、其對 Anthropic 的戰略投資以及其消費業務。

Mythos

上週，Anthropic 發布了其最先進的模型 Mythos。而且，以某種典型的 Anthropic 方式，它通過關注其危險性來進行發布；摘自 Project Glasswing（該公司利用 Mythos 應對安全問題的倡議）的介紹文章：

我們成立 Project Glasswing 是因為我們在 Anthropic 訓練的一個新前沿模型中觀察到了某些能力，我們相信這些能力可能會重塑網絡安全。Claude Mythos Preview 是一個通用、尚未發布的前沿模型，它揭示了一個嚴峻的事實：AI 模型的編碼能力已達到一個水平，在發現和利用軟體漏洞方面，它們可以超越除了最熟練的人類之外的所有人。

Mythos Preview 已經發現了數千個高嚴重性漏洞，其中包括每個主要操作系統和網頁瀏覽器中的漏洞。鑑於 AI 進步的速度，這些能力很快就會擴散，甚至可能超出那些致力於安全部署的參與者。這對經濟、公共安全和國家安全的後果可能是嚴重的。Project Glasswing 是一次緊急嘗試，旨在將這些能力用於防禦目的。

在上週的一篇更新中，我將 Anthropic 這種「災難色情式行銷」比作放羊的孩子；這個類比的重要之處不僅在於那個孩子發出了虛假警報，還在於最終狼真的來了。為此，我在兩週前寫過關於支撐所有軟體的無數安全問題，以及我對 AI 長期解決這些問題的樂觀態度，即使它在短期內會讓事情變得更糟。換句話說，Mythos 是否代表重大安全威脅其實並不重要：如果這個模型不是，未來的模型也會是；因此，我確實支持利用 Mythos 主動發現並修復漏洞，以免被惡意行為者發現並利用。

與此同時，值得注意的是，Anthropic 不廣泛開放 Mythos 還有其他原因，即將訪問權限限制在少數具有高能力和高付費意願的公司。首先是那些機會成本：Anthropic 的算力在服務現有模型時已經捉襟見肘；上週末 X（原 Twitter）上充斥著投訴和辯論，稱 Anthropic 在過去一個月左右疑似降低了 Claude 的智商。讓 Mythos 更廣泛地可用——特別是對於不按使用量付費的訂閱方案——會讓情況變得更糟。

換句話說，Anthropic 面臨的不是邊際成本問題，而是機會成本問題：如何分配其算力。當然，這可能會演變成利潤率問題：我懷疑 Anthropic 將通過從超大規模業者和新興雲端服務商（neoclouds）那裡獲取更多算力，並為此支付高昂代價，來克服其在算力方面的保守主義。

處理這些成本的關鍵將是未來對 Claude 收取更高費用；延伸開來，這意味著要維持定價權，這引出了不廣泛發布 Mythos 的第二個好處。Anthropic 當然面臨來自 OpenAI 的競爭；然而，對於這兩家前沿實驗室來說，長期的真正競爭對手是開源模型。目前這些模型主要來自中國，而快速跟進前沿模型的關鍵要素是「蒸餾」（distillation）；摘自 Anthropic 的部落格：

我們發現了三個 AI 實驗室——DeepSeek、月之暗面（Moonshot）和 MiniMax——進行的工業級規模活動，旨在非法提取 Claude 的能力以改進他們自己的模型。這些實驗室通過約 24,000 個欺詐帳戶與 Claude 進行了超過 1,600 萬次交流，違反了我們的服務條款和區域訪問限制。

這些實驗室使用了一種稱為「蒸餾」的技術，即在更強大模型的輸出上訓練一個能力較弱的模型。蒸餾是一種廣泛使用且合法的訓練方法。例如，前沿 AI 實驗室經常蒸餾自己的模型，為客戶創建更小、更便宜的版本。但蒸餾也可以用於非法目的：競爭對手可以利用它，以獨立開發所需時間和成本的一小部分，從其他實驗室獲取強大的能力。

我絕對相信這是一個真實的問題，並且在去年 DeepSeek R1 發布時也寫過類似的觀點。我也認為，除了前沿實驗室之外，所有人的利益都在於假裝這不是問題；開源模型不受前沿實驗室溢價或算力約束的限制，這正是為什麼大多數公司都能從中受益，無論它們是否經過蒸餾。當然，這並不意味著它們可以免費運行：你仍然需要提供算力。

然而，請注意，這使得停止蒸餾成為前沿實驗室更優先的任務：首先，他們想保護自己的利潤率。其次，他們最大的成本是機會成本：那些因為算力不足而無法服務的客戶。他們能在多大程度上降低算力對潛在客戶的效用（通過阻止開源模型蒸餾他們的模型），他們就能在多大程度上以更有利的價格為自己獲取這些算力。

Meta Muse

Mythos 並不是上週宣布的唯一新模型：Meta 也發布了其新前沿實驗室的第一個成果。摘自該公司的部落格文章：

今天，我們很高興推出 Muse Spark，這是由 Meta 超級智能實驗室（Meta Superintelligence Labs）開發的 Muse 系列模型中的第一個。Muse Spark 是一個原生多模態推理模型，支持工具使用、視覺思維鏈和多智能體編排。

Muse Spark 是我們擴展階梯的第一步，也是我們從底層徹底改革 AI 努力的第一個產品。為了支持進一步擴展，我們正在整個堆棧進行戰略投資——從研究和模型訓練到基礎設施，包括 Hyperion 數據中心……

Muse Spark 在多模態感知、推理、健康和智能體任務方面提供了具競爭力的表現。我們將繼續投資於目前存在性能差距的領域，例如長跨度智能體系統和編碼工作流。

Muse Spark 雖然不是頂尖水平（state of the art），但它已進入賽場，總體而言是 Meta 超級智能實驗室給人的積極第一印象。然而，對我來說最值得注意的是，過去九個月的 AI 發展清楚地表明，執行長 Mark Zuckerberg 決定對 Meta 的 AI 努力進行「從底層徹底改革」是正確的決定。

引發我文章開頭提到的 O’Laughlin 貼文的誘因是「推理」，即模型使用更多 token 會產生更好的答案；從那以後，智能體（agents）呈指數級增加了 token 需求，因為它們可以在沒有人類參與的情況下持續使用 LLM。這是 Claude 以及 OpenAI 的 Codex 需求飆升的巨大驅動力。此外，這個用例的潛在利潤如此之高，以至於不僅 Anthropic 的營收在飆升，OpenAI 也正將重心轉向企業端。

事實上，你可以辯論說 OpenAI 最大的挑戰之一在於它擁有 ChatGPT 這樣一個受歡迎的消費級產品。我一直以聚合理論的視角認為，用戶群是 OpenAI 的巨大優勢，但那是假設公司能有效地將其變現，這也是為什麼我如此強烈地主張廣告模式。OpenAI 對此有宏大的預測，但在那實現之前，龐大的消費用戶群在 OpenAI 的專注力和算力方面是一個巨大的機會成本。該公司在廣泛的質疑聲中，確實對更多算力進行了重大投資，這值得稱讚，但將越來越多的算力分配給企業願意付費的智能體用例（即使以犧牲消費業務為代價）的誘惑力將會非常大。

這使得 Meta 相對於行業內其他公司處於獨特地位：與任何超大規模業者或前沿實驗室不同，Meta 沒有企業或雲端業務需要擔心。這意味著服務消費市場不會帶來機會成本。當然，考慮到 Meta 已經擁有成熟的廣告業務來將使用量變現，這些機會成本本來就會小得多。換句話說，Meta 在贏得消費市場方面面臨的競爭實際上可能比幾個月前看起來要小，僅僅是因為那是他們的主要焦點——而且因為他們擁有自己的模型，這意味著他們不需要擔心無法訪問前沿實驗室（當然，這套分析很大程度上也適用於 Google）。

同樣的道理，這也是為什麼 Meta 應該像對待 Llama 一樣開源 Muse。受前沿模型廣泛可用傷害最深的是其他前沿實驗室，他們的定價權將被削弱，並面臨更激烈的算力競爭。這將使他們更難承擔追求消費市場的機會成本，從而將其留給 Meta。

需求 vs. 供應

那麼，「聚合理論的時代……已經過去」了嗎？一方面，通過擁有客戶來創造和維持價值的洞察，幾乎肯定會繼續成立。在消費端，擁有客戶會帶來廣告，從而提供為客戶提供服務所需的收入。在企業端——我要指出，這從來不是聚合理論適用的領域——我認為 Anthropic 和 OpenAI 很可能會繼續向堆棧上方移動，並提供直接與軟體供應商競爭的功能（這種做法也符合不公開領先模型的策略）。

另一方面，O’Laughlin 觀察到我們現在和未來都將受到算力約束，這是一個重要的觀點：公司將無法假設他們可以服務所有人，因為服務一組客戶就意味著不服務另一組客戶的機會成本。至少在理論上，這不會永遠持續下去：在某個時點，AI 對於足夠多的用例來說將「足夠好」，屆時將有足夠的算力容量來利用服務 AI 確實沒有實質邊際成本這一事實；然而，那個理論上的未來感覺比以往任何時候都更加遙遠。

OpenAI 押注這種算力約束——以及他們為克服它而達成的交易——將比 Anthropic 目前在終端用戶中的勢頭更重要。摘自 Bloomberg：

OpenAI 本週告訴投資者，其大幅增加計算資源的早期推動，使其在長期競爭對手 Anthropic PBC 取得進展並考慮潛在 IPO 之際，擁有了關鍵優勢。

根據該公司在 Anthropic 發布名為 Mythos 的更強大 AI 模型後發給部分投資者的備忘錄，這家 ChatGPT 製造商表示，它通過「快速且持續地」增加計算能力來支持其軟體的更廣泛採用，從而超越了 Anthropic。備忘錄指出，這種雄心勃勃的基礎設施建設雖然被一些人批評為成本過高，但使 OpenAI 能夠更好地跟上對 AI 產品日益增長的需求。

我不太確定這是否具有決定性。當涉及到 AI 時，分銷和交易成本仍然是免費的——這是聚合者的兩個前提條件——這意味著贏家應該是那些擁有最引人入勝產品的人。這些產品將贏得最多的用戶，提供獲取算力以服務他們所需的資金；考慮 Anthropic 確保了很大一部分 TPU 供應的交易，鑑於台積電的產能限制，這最終是從 Google 手中奪取供應的一個例子。我懷疑 Anthropic 可以獲取更多，包括已經建成的超大規模業者和新興雲端產能。是的，那些算力會更貴，但如果需求足夠高，必要的現金流就會在那裡。

換句話說，我的賭注是，擁有需求最終將勝過擁有供應，這表明聚合理論的底層原則依然存在。換種說法，我認為 OpenAI 需要依靠更好的產品獲勝，而不僅僅是更多的算力；但話又說回來，如果更多算力是更好產品的關鍵，那麼供應是否最重要？無論如何，他們肯定會專注於為那些推動 Anthropic 驚人增長的企業客戶提供這兩者。真正的代價可能是他們目前主導的消費市場，因為 Meta 在那裡沒什麼可失去的，卻有一切可以贏得。

https://stratechery.com/?p=18769

你的個人知識庫