代理編排:知識型工作的全新生產線
當人們談論 AI 加速藥物開發或引發失業恐懼時,核心其實是 AI 代理。AI 需要從單純的對話轉向實際執行任務,而最新的多代理工具能像團隊一樣協作,將編碼、辦公與科學研究轉化為自動化生產線,但在賦予其處理現實世界基礎設施的權力時,也伴隨著巨大的預測風險。
當人們說 AI 將加速藥物研發,或擔心它會引發大規模裁員時,他們腦海中浮現的——無論自覺與否——正是 AI 代理(AI agents)。ChatGPT 讓大型語言模型成為了大眾消費品。但要改變世界,AI 需要做的不僅僅是回話:它需要「做事」。而這正是代理派上用場的地方。
現在,在經過大量炒作之後,首批名副其實的多代理工具正開始展露頭角。
OpenClaw——一個你可以透過手機與之交談的個人 AI 助手——吸引了所有人的注意。在熱潮之下,OpenClaw 的招數有限,且在安全性上採取了破壞者式的做法。但它讓人感覺像是未來。因此,從 Nvidia 到騰訊等公司都迅速在 OpenClaw 的開源代碼基礎上,構建了自己更安全、更可靠的機器人。
但代理真正的力量在於它們能像團隊一樣協作。新工具不再是執行單一任務的「孤狼式」機器人(例如使用瀏覽器預訂餐廳或為你發送收件箱摘要),而是可以將多個代理連結在一起,賦予每個代理不同的職責,並協調它們的行為,使它們共同完成比單個代理獨立運作更複雜的任務。
例如,Anthropic 去年發布的 Claude Code 讓你能夠同時啟動並協調多個編程代理(有些用戶報告同時運行多達數十個子代理),不同的代理同時處理代碼庫的不同部分。代理也可以被賦予特定角色:一個編寫代碼,另一個進行測試,第三個修復錯誤,依此類推。這類工具有望將程序員轉變為專案經理,讓他們能夠委派並監督比自己親力親為更多的任務。
但編程只是開始。最新的多代理工具針對的是那些不需要或不想開發軟體的人。桌面應用程式如 Anthropic 的 Claude Cowork(該公司聲稱僅用 10 天就利用 Claude Code 構建完成,而此類專案通常需要數月時間)、OpenAI 的 Codex 以及 Perplexity 的 Computer,都被定位為面向白領專業人士的通用生產力工具。它們讓你將客製化的工作流程交給代理團隊,由其協調各種基於電腦的辦公任務,從管理收件箱和庫存到處理客戶投訴。
而且這不僅限於辦公室工作。像 Google DeepMind 的 Co-Scientist 這樣的多代理工具,讓研究人員能夠利用 AI 代理團隊來協調文獻檢索、生成並測試假設、設計實驗等。
將多代理系統視為新的「流水線」。亨利·福特(Henry Ford)的創新在上個世紀顛覆了整個產業。理論上,AI 代理網絡對白領知識工作所能產生的影響,可能等同於流水線對製造業的貢獻。
至少這是願景。因為這項技術也伴隨著巨大的風險。眾所周知,大型語言模型(LLMs)具有不可預測性。當聊天機器人被困在螢幕內時,這只是一種困擾;當它們開始更多地與現實世界互動時,這可能是災難性的。我們準備好讓代理在我們無處不在的數位基礎設施中橫衝直撞了嗎?從醫療保健到金融,從社交媒體到導彈發射器。
相關文章
其他收藏 · 0