代理編排：知識型工作的全新生產線

MIT Technology Review·大約 4 小時前

當人們談論 AI 加速藥物開發或引發失業恐懼時，核心其實是 AI 代理。AI 需要從單純的對話轉向實際執行任務，而最新的多代理工具能像團隊一樣協作，將編碼、辦公與科學研究轉化為自動化生產線，但在賦予其處理現實世界基礎設施的權力時，也伴隨著巨大的預測風險。

當人們說 AI 將加速藥物研發，或擔心它會引發大規模裁員時，他們腦海中浮現的——無論自覺與否——正是 AI 代理（AI agents）。ChatGPT 讓大型語言模型成為了大眾消費品。但要改變世界，AI 需要做的不僅僅是回話：它需要「做事」。而這正是代理派上用場的地方。

現在，在經過大量炒作之後，首批名副其實的多代理工具正開始展露頭角。

OpenClaw——一個你可以透過手機與之交談的個人 AI 助手——吸引了所有人的注意。在熱潮之下，OpenClaw 的招數有限，且在安全性上採取了破壞者式的做法。但它讓人感覺像是未來。因此，從 Nvidia 到騰訊等公司都迅速在 OpenClaw 的開源代碼基礎上，構建了自己更安全、更可靠的機器人。

但代理真正的力量在於它們能像團隊一樣協作。新工具不再是執行單一任務的「孤狼式」機器人（例如使用瀏覽器預訂餐廳或為你發送收件箱摘要），而是可以將多個代理連結在一起，賦予每個代理不同的職責，並協調它們的行為，使它們共同完成比單個代理獨立運作更複雜的任務。

例如，Anthropic 去年發布的 Claude Code 讓你能夠同時啟動並協調多個編程代理（有些用戶報告同時運行多達數十個子代理），不同的代理同時處理代碼庫的不同部分。代理也可以被賦予特定角色：一個編寫代碼，另一個進行測試，第三個修復錯誤，依此類推。這類工具有望將程序員轉變為專案經理，讓他們能夠委派並監督比自己親力親為更多的任務。

但編程只是開始。最新的多代理工具針對的是那些不需要或不想開發軟體的人。桌面應用程式如 Anthropic 的 Claude Cowork（該公司聲稱僅用 10 天就利用 Claude Code 構建完成，而此類專案通常需要數月時間）、OpenAI 的 Codex 以及 Perplexity 的 Computer，都被定位為面向白領專業人士的通用生產力工具。它們讓你將客製化的工作流程交給代理團隊，由其協調各種基於電腦的辦公任務，從管理收件箱和庫存到處理客戶投訴。

而且這不僅限於辦公室工作。像 Google DeepMind 的 Co-Scientist 這樣的多代理工具，讓研究人員能夠利用 AI 代理團隊來協調文獻檢索、生成並測試假設、設計實驗等。

將多代理系統視為新的「流水線」。亨利·福特（Henry Ford）的創新在上個世紀顛覆了整個產業。理論上，AI 代理網絡對白領知識工作所能產生的影響，可能等同於流水線對製造業的貢獻。

至少這是願景。因為這項技術也伴隨著巨大的風險。眾所周知，大型語言模型（LLMs）具有不可預測性。當聊天機器人被困在螢幕內時，這只是一種困擾；當它們開始更多地與現實世界互動時，這可能是災難性的。我們準備好讓代理在我們無處不在的數位基礎設施中橫衝直撞了嗎？從醫療保健到金融，從社交媒體到導彈發射器。

— MIT Technology Review

其他收藏 · 0

你的個人知識庫

代理編排：知識型工作的全新生產線