AI 的盛夏盛景與現實挑戰

Benedict Evans·將近 2 年前

數億人試用過 ChatGPT，但大多數人沒再回頭。每家大公司都做了試點，但真正投入部署的少之又少。這或許只是時間問題，但也可能 LLM 是一個陷阱：它們看起來像產品且帶有魔力，但事實並非如此。也許我們終究得經歷尋找產品市場契合度那段緩慢且無聊的過程。

我的前老闆 Marc Andreessen 喜歡說，網路泡沫時期每一個失敗的點子現在都能成功。這只是需要時間——建立寬頻網路花了好幾年的時間，消費者必須購買個人電腦，零售商和大公司需要建立電子商務基礎設施，整個線上廣告業務必須演進與成長，更根本的是，消費者和企業必須改變他們的行為。未來可能需要一段時間才能實現——美國零售業花了 20 多年才將 20% 的份額轉移到線上。

人們現在忘了這一點，但 iPhone 的普及也花了不少時間。蘋果在最初的 12 個月內僅售出 540 萬台，直到 2010 年銷量才真正爆發（iPod 花的時間更長）。同樣的情況當然也適用於企業端。如果你在科技業工作，雲端已經是老掉牙且完成的事情，但在 Marc Benioff 試圖說服人們在瀏覽器中運行軟體的 25 年後，雲端仍僅佔企業工作流程的三分之一左右。

ChatGPT 的發展快得多。它在 2022 年底爆發式地進入我們的意識，並幾乎立即奪走了科技界所有的關注。如果你今天創辦一家不專注於生成式 AI 的新創公司，你所有的朋友都會指著你嘲笑；但更重要的是，ChatGPT 在短短 2 個月內就達到了 1 億用戶。到今年春天，聽說過並使用過它的人數達到了前所未有的規模。

正如對科技普及加速的所有觀察一樣，這在很大程度上是「站在巨人的肩膀上」——OpenAI 不需要等待人們購買設備，也不需要電信商建設 DSL 或 3G 網路。對於消費者來說，ChatGPT 只是一個網站或一個應用程式，而且（起初）它可以搭載在我們過去 25 年建立的所有基礎設施之上。因此，去年有大量的人去嘗試了它。

問題在於，他們中的大多數人之後就沒再回來。如果你問「使用」實際上意味著什麼，結果顯示大多數人只是玩了一兩次，或者每隔幾週才回去用一次。

正如圖表說明所指出的，這是一張非常「半杯水」式的圖表。一方面，在 18 個月內讓發達國家四分之一到三分之一的人口嘗試一個新產品是非常困難的。但另一方面，大多數嘗試過的人並沒有看出它有什麼用。

當然，這裡存在選擇性偏差：如果你買了一支 650 美元的智慧型手機，你已經決定了它是實用的，你放棄它的可能性遠低於一個你只花了 5 分鐘把玩的網站。你也可以指出，模型的最佳版本通常隱藏在付費牆之後。

但如果這是將改變一切的神奇事物，為什麼大多數人實際上會聳聳肩說「很聰明，但不適合我」然後走開？為什麼在過去 9 到 12 個月裡，活躍用戶（相對於模糊的好奇者）沒有太多增長，正如一系列類似的調查所示？最能說明問題的——可能——是 Google 趨勢（Google Trends），雖然使用時必須始終保持謹慎，但它似乎顯示出與學校假期的相關性。

你可以用幾種方式來回答這個問題。圍繞一種全新類型的工具改變你的習慣和思維方式確實需要時間（還記得我們以前會把電子郵件印出來嗎？）。我們可以確定模型至少在某種程度上會變得更好——代理（agents）、語音和多模態將擴展它們能解決的問題。但我也曾主張（例如去年十月在這裡），LLM 本身並不是一個產品——它是一種可以賦能工具或功能的技術，它需要被拆解或重新打包成新的框架、使用者體驗和工具才能變得有用。這需要更多的時間。

我認為你可以從 Bain 調查企業使用 LLM 的數據中看到同樣的問題。這同樣是一張半杯水的圖表：有很多興趣，也有相當多的部署，但這取決於你觀察的角度。

與某些調查不同（那些調查實際上只是問「你們組織中是否有人在用這個？」——答案通常是肯定的），Bain 試圖將試點、實驗和測試與正式部署區分開來。每個人都有一些測試項目，但目前信任並將其應用於業務的人要少得多，而且這會根據你的使用案例而有巨大差異。LLM 對於編碼和行銷已經非常有用，但對於律師或人力資源則沒那麼有用（儘管律師在採用任何新技術方面顯然都很慢）。

與此同時，埃森哲（Accenture）為我們提供了一個極佳的範例，說明了企業實驗的規模，但也說明了目前它僅僅是實驗——這又是另一個半杯水的例子。去年夏天，它自豪地宣布已經為客戶完成了 3 億美元的「生成式 AI」工作……並且完成了 300 個項目。即使是 LLM 也能算出 300 除以 300 等於多少——那是大量的試點，而不是部署。自那以後，這個數字增長了很多，但組合比例如何？事實上，隨著 BCG 表示預計今年 20% 的收入將來自幫助大公司弄清楚如何應對生成式 AI，20 24 年這項技術帶來的最大單一業務可能是顧問在解釋它是什麼。（這也是唯一有人想找我聊的事情。）

這些圖表中的很大一部分實際上是關於當 AI 極大主義的烏托邦夢想遇到消費者行為和企業 IT 預算的混亂現實時會發生什麼——這比你想像的要花更長的時間，而且很複雜（這也是我認為「末日論者」很天真的原因之一）。典型的企業 IT 銷售週期比 ChatGPT 3.5 發布以來的時間還要長，而摩根士丹利最新的 CIO 調查顯示，30% 的大公司 CIO 預計在 2026 年之前不會部署任何東西。他們可能過於謹慎，但上面的雲端普及圖表（尤其是預期數據）暗示了相反的情況。另外請記住，Bain 的「生產（Production）」數據僅意味著它在某處被用於某事，並不代表它已經接管了你的工作流程。

退一步看，ChatGPT 從一個科學項目到擁有 1 億用戶的速度之快，本身可能就是一個陷阱（有點像自然語言處理之於 Alexa）。LLM 看起來像是在運作，看起來很通用，而且看起來像是一個產品——它們背後的科學交付了一個聊天機器人，而聊天機器人看起來就像一個產品。你輸入一些東西，就能得到神奇的回應！但這種形式的神奇可能並不實用，而且可能是錯誤的。它看起來像產品，但其實不是。

微軟在去年年初失敗且被遺忘的嘗試將此功能強加於 Bing 並挑戰 Google，是這個問題的一個縮影。LLM 看起來像更好的資料庫，看起來像搜尋，但正如我們後來所見，它們「錯誤」得足夠多，而且這種「錯誤」很難管理，以至於你不能只給用戶一個原始提示和一個原始輸出——你需要在其周圍構建大量專門的產品，即便如此，目前還不清楚這有多大用處。急於推出 LLM 網頁搜尋就是掉進了那個陷阱。Satya Nadella 說他想「讓 Google 跳舞」，但諷刺的是，與「Bing Copilot」競爭的最佳方式可能是按兵不動——在發布任何東西之前等待、觀察、學習並徹底解決問題（當然，如果華爾街允許的話）。

急於將其加入搜尋是源於競爭壓力和股市壓力，但更根本的是源於一種感覺：這是下一個平台轉移，你必須雙手抓住它。這遠不止於 Google。這種緊迫感被那種「站在巨人肩膀上」的時刻所加速——你沒有時間等待人們購買設備——以及這些東西看起來像成品的方式。與此同時，這些公司在過去十年中產生的巨額現金流，與尖端 LLM 巨大的資本密集度相撞，就像物質遇到了反物質。

換句話說——「這些東西就是未來，現在就會改變一切，它們需要這麼多錢，而我們正好有這麼多錢。」

正如許多人現在指出的那樣，這一切加總起來，就是針對一項大多仍處於實驗預算中的技術，提前投入了多到令人咋舌的資本支出（以及許多其他投資）。

這種倉促意味著我們跳過了 S 曲線底部緩慢而痛苦的時期，即在你構建實際產品的同時，試圖弄清楚產品與市場契合（product-market fit）是什麼樣子的。網路、電子商務和 iPhone 都必須經歷一個痛苦的成長和學習過程才能變得有用。App Store 最初並不在 iPhone 的計劃中，而 Tim Berners-Lee 最初的網頁瀏覽器包含了一個編輯器，因為這看起來像是一個更好的網路磁碟機（去問問你的父母），而不是一個發布平台。LLM 跳過了那個弄清楚它是什麼以及它是用來做什麼的階段，在遇到真正的用戶之前就直接進入了「它是為了應對一切！」的階段。

這使得這張圖表特別有趣。直截了當的懷疑論解釋是，這是一次經典的投資激增，不可避免地會演變成泡沫（如果現在還不是的話），就像上面那兩個一樣。

但你也可以認為，這些新創公司是矽谷的一次集體賭注，賭的是 LLM 是一種技術而非產品，我們需要經歷傳統的客戶開發過程來實現產品與市場的契合。至少可以說，真正驅動生成式 AI 泡沫的想法是認為歷史已經結束，LLM 將能夠做任何事情，如果是那樣的話，我們就不需要任何這些公司了。從這個觀點來看，這些公司是「反泡沫」（一個巧妙的樂觀主義想法）。

當然，網路泡沫時期的瘋狂夢想確實實現了，AI 極大主義者可能是正確的——LLM 可能真的能搞定一切。LLM 可能能夠吞噬大部分或全部現有軟體，並且可能能夠自動化大量以前從未納入軟體的新型任務，僅憑其自身以及圍繞它們構建的全新產品層、公司和企業銷售。這可能是科技史上第一個被證明是 J 曲線而非 S 曲線的案例。但不會是今年。

— Benedict Evans

你的個人知識庫

AI 的盛夏盛景與現實挑戰