newsence
OpenClaw 熱潮席捲矽谷,Google 調整瀏覽器代理人團隊佈局

OpenClaw 熱潮席捲矽谷,Google 調整瀏覽器代理人團隊佈局

Wired - AI·17 天前

隨著矽谷對 AI 編碼代理人的痴迷,Google 正在調整其瀏覽器代理人 Project Mariner 的團隊,將重心轉向更高優先級的項目與更具效率的代理人策略。

據 WIRED 獲悉,Google 正在調整其 Project Mariner 背後的團隊。Project Mariner 是一款能導覽 Chrome 瀏覽器並代表用戶完成任務的 AI 代理程式(agent)。據兩位知情人士透露,近幾個月來,部分參與該研究原型的 Google Labs 員工已轉往更高優先級的專案。

Google 發言人證實了這些變動,但表示在 Project Mariner 下開發的電腦操作能力將納入公司未來的代理程式策略中。該發言人補充,Google 已經將其中一些功能整合到其他代理程式產品中,包括最近推出的 Gemini Agent。

這項變動發生之際,Google 和其他 AI 實驗室正急於應對 OpenClaw 等高效能代理程式的崛起。雖然這些工具目前主要由開發者使用,但矽谷相信它們很快就能為個人和企業提供通用型助手。Nvidia 執行長黃仁勳將這款熱門工具比作代理式電腦的新作業系統。他在本週早些時候的公司開發者大會上表示:「當今世界上的每家公司都需要有 OpenClaw 策略。」

Google 執行長 Sundar Pichai 在去年的 I/O 大會上重點介紹了 Project Mariner。當時,瀏覽器代理程式似乎是業界的下一個大賭注,OpenAI 和 Perplexity 都推出了承諾為用戶自動化線上任務的消費級代理程式。這些代理程式可以像人類一樣在網頁上點擊、捲動和填寫表格。然而,這些產品的採用率一直難以達到業界預期。

Perplexity 的 Comet 瀏覽器代理程式在 2025 年 12 月的每週活躍用戶數僅為 280 萬。與此同時,據報導 OpenAI 的 ChatGPT Agent 近幾個月的每週活躍用戶數下降至不到 100 萬。與每週與 ChatGPT 對話的數億用戶相比,瀏覽器代理程式的使用量基本上可以忽略不計。

領域新秀崛起

過去一年,AI 界的勢頭已大幅轉向 Claude Code 和 OpenClaw(其創始人已被 OpenAI 挖角)等代理程式。與網頁瀏覽代理程式不同,這些系統透過命令行(command-line)控制電腦,事實證明這是一種更可靠的任務完成方式。其中一些產品將電腦操作(computer use)作為一項功能,與其他代理能力並列。相比之下,瀏覽器代理程式作為獨立產品現在顯得有些侷限。

AI 技能提升平台 Workera 執行長、同時在史丹佛大學教授 AI 課程的 Kian Katanforoosh 表示,電腦操作代理程式未能普及的部分原因在於其龐大的運算需求。大多數這類代理程式的運作方式是擷取網頁的一系列螢幕截圖,將其輸入 AI 模型,然後根據所見內容採取行動。處理所有這些資訊可能很慢,且有時不可靠。

Katanforoosh 說:「Claude Code 和 OpenClaw 展示了與終端機(terminal)合作實際上效率更高,因為終端機是基於文本的,而大型語言模型(LLM)也是基於文本的。達到同樣結果所需的步驟可能減少了 10 到 100 倍。」

這並不是說瀏覽器代理程式沒有進步,或者對電腦操作的研究已走入死胡同。

上個月,新創公司 Standard Intelligence 發布了一個基於影片而非螢幕截圖訓練的電腦操作模型。該公司表示,他們開發了一種影片編碼器,可以將影片壓縮到 AI 模型的上下文窗口中,並聲稱這比之前的電腦操作模型效率高出 50 倍。為了展示其 AI 模型的能力,該公司將其連接到一輛汽車、一個實時影片串流和一個電腦鍵盤。該模型能夠在舊金山周邊進行短暫的自動駕駛。

電腦操作代理程式新創公司 Simular 的執行長、前 Google DeepMind 研究員 Ang Li 認為,電腦操作代理程式填補了代理能力的關鍵空白,且可能永遠有其必要性。

他說:「我確實認為始終存在 80/20 的分配。你已經可以使用終端機解決很多問題,但總會有些問題必須在 GUI(圖形使用者介面)中解決。例如,如果你想進入醫療保險網站或其他舊版軟體,它們通常沒有終端代理程式可以直接調用的 API。」

儘管如此,AI 實驗室似乎普遍將賭注從電腦操作代理程式轉向編碼代理程式(coding agents)。即使是對於不涉及編碼的任務,AI 實驗室也發現編碼代理程式使用其他應用程式、修改文件和創建客製化軟體的能力,能讓它們對用戶更有幫助。例如,如果有人需要協助制定預算,他們可以將銀行對帳單上傳到編碼代理程式,並讓它創建一個自定義儀表板來幫助用戶評估消費習慣。

OpenAI 高層表示,他們希望讓 Codex 為 ChatGPT 內部的通用代理程式提供動力。與此同時,Anthropic 已經構建了一個名為 Claude Cowork 的版本,它是 Claude Code 的分支,不需要用戶打開終端機。曾重金押注瀏覽器代理程式的 Perplexity 最近也推出了一款名為 Personal Computer 的類似產品。

雖然編碼代理程式已在開發者中流行起來,但尚不清楚增加的功能是否會提高普通大眾的採用率。Google 和 OpenAI 曾表示,消費者可以使用 AI 代理程式從 Instacart 訂購雜貨或預訂晚餐。雖然這些聽起來確實很方便,但在確定代理程式不會出錯之前,人們可能還不想將此類任務自動化。

https://wired.com/story/google-shakes-up-project-mariner-team-web-browsing-agents/