Claude Codes #3:Anthropic 在 AI 領域的日益增長的勢頭
Anthropic 的 Claude Code 和 Cowork 正展現出強大的勢頭,營造出一個「GPT 時刻」,讓使用者和投資者意識到這些工具能讓非技術人員也能高效構建複雜軟體。我發現最近的升級,如改進的 diff 視圖、VSCode 整合和 MCP 工具搜尋,讓工作流程變得更加強大,特別是與 Obsidian 等工具結合使用時。
我們帶著所有適合編程的 Claude 資訊回來了。我依然從中獲得極大樂趣並發現了許多實用的升級,但最大的提醒是:你需要讓這門藝術擁有除了自身以外的目標。不要花太多時間在改進你的環境配置上,特別是改進「你如何改進環境配置」這件事,而沒有真正去處理有用的事情。
有效市場假說
Odd Lots 報導了 Claude Code。很有趣的一集,但對我的長期讀者來說,學不到太多新東西。
《華爾街日報》的 Bradly Olsen 報導稱 Claude [Code 以及現在的 Cowork] 席捲 AI 世界,「連非技術宅都被震撼了」。
令人注目的是,每個人原本都隨著 Gemini 3 塑造出「Google 正在碾壓所有人」的敘事,接著他們花了一個月才意識到,實際上是 Anthropic 正在碾壓所有人——至少在那些影響力日益擴大的圈內人(cognoscenti)中是如此,這要歸功於 Claude Code 和 Claude Opus 4.5。人們正意識到,你即使幾乎一竅不通,仍能用它來完成基本上所有事情。
Claude Code 和 Codex 是否正迎來「GPT 時刻」?
Wall St Engine:摩根士丹利表示,Anthropic 的 ClaudeCode + Cowork 正主導投資者的討論,並對軟體業增加壓力。
他們指出 OpenRouter 的代幣(token)增長正呈現「垂直式上升」,加上有傳聞稱 Cowork 的發布推動了極高的使用量,甚至導致 Opus 4.5 崩潰並觸及速率限制,將其定性為另一個「GPT 時刻」,且對 AI 資本支出(capex)是利多。
他們補充說,對 OpenAI 的情緒依然不穩:雖然對新一輪融資和第二季由 Blackwell 訓練的模型抱有一些樂觀,但競爭擔憂已從 $GOOGL 擴大到 Anthropic,且 Elon Musk 表示針對 OpenAI 轉型營利的訴訟將於 4 月 27 日開庭。
嘿,升級了
Claude Cowork 現在已開放給 Pro 訂閱者,而不僅限於 Max 訂閱者。
Claude Cowork 在執行所有刪除操作前會明確詢問許可,在目錄選擇器中添加新資料夾時無需重新開始,並能提供更聰明的連接器(connector)建議。
網頁版的 Claude Code 獲得了美觀的 diff(差異對比)視圖。
VSCode 版的 Claude Code 現已正式發布,其實它已經推出一段時間了。要拖放文件,請按住 shift 鍵。
Claude Code 現在在各個城市舉辦「社群活動」。紐約和舊金山不在名單上,但也沒必要在上面。
Claude Code 升級至 2.1.9,接著是 2.1.10 和 2.1.11(微幅更新),現在已達到 2.1.14。
很少有人針對這句話進行適當的更新:「Claude Codex 是用 Claude Code 在 1.5 週內開發出來的。」
Nabeel S. Qureshi:我甚至不明白你現在怎麼還能當一個 AI「懷疑論者」,當目前擺在我們眼前的 AI 已經如此強大,例如看到 Claude Cowork 是由 Claude Code 在 1.5 週內寫成的。
結束了,懷疑論者錯了。
規劃模式(Planning mode)現在在你接受計畫時會自動清除上下文。
Anthropic 正在為 Claude 開發一個新的「自定義」(Customize)區塊,以集中管理 Claude Code 的技能(Skills)、連接器和即將推出的指令。我的理解是,如果你想創建自定義指令,它們已經存在了,但減少摩擦力(包括減少「減少摩擦力過程中的摩擦力」)通常極具價值。一個能輕鬆瀏覽技能、與文件互動、查看並管理連接器,或定義新指令的簡單界面,看起來非常棒。
Obsidian
我強烈建議將 Obsidian 或類似工具與 Claude Code 配合使用。這能讓你直觀地看到所有 Markdown 文件,並讓你輕鬆導航、搜索、編輯以及添加更多內容。我認為保持這一切對人類(也就是你)可讀是非常值得的。
Heinrich 稱之為「氛圍筆記」(vibe note taking),無論你是否使用 Obsidian。我認為筆記是一個你應該少一點「憑感覺」、多一點「有意識」的地方,並且應該系統性地優化筆記,無論是為了 Claude Code 還是為了你自己使用。
你可以透過 Obsidian 的終端機插件直接結合 Obsidian 和 Claude Code,但我看不出這樣做有什麼機械上的優勢。
新工具
Siqi Chen 為我們提供了 /claude-continuous-learning。Claude 的評估是,如果你在需要持續學習事物的代碼庫中工作,這可能很好,但額外的開銷和雜亂的風險是真實存在的。
Jasmine Sun 創建了一個工具,可以將任何 YouTube 播客轉換為乾淨、符合語法的 PDF 逐字稿,並附帶章節和重點摘要。
工具搜索
Claude Code 2.1.7 版本的一大變化是預設啟用了 MCP 工具搜索自動模式,當 MCP 工具佔用超過 10% 的上下文窗口時會觸發。你可以透過在設置中的 disallowedTools 添加 MCPSearch 來禁用此功能。對於同時使用大量 MCP 的人來說,這似乎很重要,因為這可能會吃掉大量上下文。
Thariq (Anthropic):今天我們為 Claude Code 推出了 MCP 工具搜索。
隨著 MCP 成長為更受歡迎的協議,且代理(agent)能力變得更強,我們發現 MCP 服務器可能擁有高達 50 多個工具,並佔用大量上下文。
工具搜索允許 Claude Code 在 MCP 工具原本會佔用大量上下文時,動態地將工具加載到上下文中。
運作方式:
– Claude Code 會檢測你的 MCP 工具描述是否會使用超過 10% 的上下文
– 一旦觸發,工具將透過搜索加載,而非預先加載
否則,MCP 工具的運作方式與以前完全相同。這解決了我們在 GitHub 上最受期待的功能之一:MCP 服務器的延遲加載(lazy loading)。有用戶記錄了 7 個以上的服務器消耗了超過 6.7 萬個代幣。
如果你正在製作 MCP 服務器:
情況基本相同,但在啟用工具搜索後,「服務器指令」(server instructions)字段變得更有用。它能幫助 Claude 知道何時搜索你的工具,類似於技能。
如果你正在製作 MCP 客戶端:
我們強烈建議實現
ToolSearchTool,你可以在這裡找到文檔。我們實現了一個自定義搜索函數來使其適用於 Claude Code。關於程式化工具調用(programmatic tool calling)?
我們實驗過進行程式化工具調用,使 MCP 工具能透過代碼相互組合。雖然我們未來會繼續探索這一點,但我們認為最迫切的需求是推出工具搜索以減少上下文使用。
當你看到
ToolSearchTool運作時,請在這裡或 Github 上告訴我們你的想法。
解決了這個問題後,想必你應該隨時「思考 MCP」,現在加載大量的 MCP 是安全的,即使你很少單獨使用每一個。
跳出框架
是的,這正在發生。
bayes:三年前的每個人:天哪,如果 AI 變得太普及,然後利用我們對它徹底依賴的戰略優勢反過來對付我們怎麼辦?
現在的每個人:嗨 Claude,這是我的社會安全號碼和我大腦的 root 權限,我愛你,請讓我變得富有和快樂。
三年前,我們中的一些人就大聲且明確地指出,除了各種細節外,這顯然是必然會發生的。現在你可以看得很清楚了。
不給予 Claude 大量權限將會大大減慢速度。阻礙大多數人的唯一因素是擔心事情會意外地被搞得一團糟,而現在這種風險已經低得多。是的,顯然這一切會引起其他擔憂,包括提示詞注入(prompt injections),但在實踐中的個人層面上,風險回報的計算是相當明確的。這並不像 Google 以前沒有事實上擁有我們數位生活的 root 權限一樣。而且,這也不像一個真正失控的 AI 在不徵求許可的情況下就做不到這些事。
人類很快就會徹底依賴 AI,而 AI 集體將能訪問基本上所有的東西。Grok 擁有五角大廈機密信息的 root 權限,所以如果你想知道底線在哪裡,答案是沒有底線。讓正確的那個進來,並希望真的有一個是正確的?
提升技能
什麼比一個代理更好?多個代理協同工作,且不會讓你的預算爆炸。Rohit Ghumare 提供了一份指南。
Rohit Ghumare:單一代理很快就會遇到瓶頸。上下文窗口會填滿,決策變得模糊,調試變得不可能。多代理系統透過將工作分配給專門的代理來解決這個問題,類似於你組織團隊的方式。
好處是真實的:
專業化:每個代理精通一個領域,而不是在所有事情上都平庸
並行處理:多個代理可以同時處理獨立的子任務
可維護性:當某處出錯時,你確切知道該修復哪個代理
可擴展性:透過添加新代理來增加新功能,而不是重寫所有內容
代價:協調開銷。代理需要溝通、共享狀態並避免互相干擾。如果搞錯了,你只是建立了一個更昂貴的失敗模式。
你可以使用一個主管代理(supervisor agent),這可以擴展到大約 3-8 個代理,如果你需要質量控制和序列任務,且能承受速度損失。要擴展到更多,你需要層級結構(hierarchy),就像對待人類一樣,這在開銷上會變得很昂貴,同樣也像人類組織一樣。
或者,如果沒有序列步驟且任務需要交叉反應,你可以使用直接溝通的點對點群體(peer-to-peer swarm),即使過程可能有點混亂。
你可以使用共享狀態和一組對象,或者你可以傳遞消息。你還需要選擇一種記憶類型。
我的傾向是預設使用主管模式,然後是層級結構。速度會受影響,但沒那麼糟,而且你可以透過更多代理來擴展。是的,這會變貴,但通常代幣的成本不如人類時間的成本或結果的質量重要,如果能獲得更好的結果,你在代幣使用上可以相當低效。
Olivia Moore 為非技術人員提供了一份 Cursor 和 Claude Code 的基礎指南。
這是另一篇帶有基礎技巧的 Twitter 貼文。我特別需要在控制上下文和為每個問題開啟新窗口方面做得更好。
Mitchell Hashimoto:這真的很酷,我可以告訴代理 CI 在今天早些時候掛掉了,要求它使用
git bisect找出有問題的提交並修復它。然後我去上個廁所,在走廊跟人聊聊天,回來後,它完成得很出色。
通常你會想告訴 AI 哪個工具最適合這項工作。Patrick McKenzie 指出,即使你不知道正統解決方案是如何運作的,只要你知道那個正統解決方案的名字,你就可以說「使用 [X]」,這通常就足夠了。我覺得我增加很多價值的一個地方是,當我解釋為什麼我相信某個問題的解決方案存在,或者某種類型的方法應該可行時,Claude 通常就能從那裡接手。我的品味遠超我的執行能力。
藝術必須有自身以外的目標,否則會陷入無限遞迴
在改進你的環境配置時,始終要嘗試從中獲得實際用途。人們很容易想「噢,顯然如果我先做更多優化,效率會更高」,但這會阻止你了解自己真正需要什麼,並有陷入無限循環的風險。
@deepfates:順便說一下,你從 Claude Code 得到的也不是精神錯亂。那是狂躁症。
near:男人們會為了 Claude Code 狂歡一個週末,結果除了「更優化的 Claude 配置」外一無所獲。
Danielle Fong :沒關係,我還是會繼續喝那種垃圾。
palcu:今天花了一個小時調整我的
settings.local.json文件。Near:我受到的打擊大到想微調一個模型來幫我寫 Claude 的提示詞,因為我無法按照我想要的方式進行跨 Claude 提示(嗯,有時可以,但不是一直行得通)。傷亡慘重,大家在外面要保重。
near:Claude Code 是一個被詛咒的遺物,導致許多人因感受到權力而發瘋。他們忘記了出發的目的,忘記了自己是誰。現在被一百個實例的微妙嗡嗡聲所迷惑,他們不再在乎了。隨著外部世界變得模糊,輕躁狂(hypomania)發作了。
始終為了服務一個明確的目標而優化。根據需要構建你需要的組件。否則,請當心。
安全地跳過權限
Nick:需要
--dangerously-skip-permissions-except-rm(危險地跳過除刪除外的權限)Daniel San:如果你在使用
--dangerously-skip-permissions運行 Claude Code,請務必使用此掛鉤(hook)來防止文件刪除:運行:
npx claude-code-templates@latest --hook=security/dangerous-command-blocker --yes網頁:https://aitmpl.com/component/hook/dangerous-command-blocker
一旦人們開始理解如何使用掛鉤,許多自主工作流將開始解鎖!
是的,你可以使用虛擬機,但那會引入一些我們許多人想避免的摩擦。
我正在嘗試使用類似的掛鉤系統加上一堆廣泛的權限,而不是直接使用 --dangerously-skip-permissions,但絕對在考慮朝著危險地跳過權限的方向努力。
信任問題
起初,每個人都嘲笑 Anthropic 對安全和信任的痴迷,以及它愚蠢的拒絕。現在 Anthropic 已經弄清楚如何讓危險的互動變得更安全,它實際上可以反其道而行。在採取行動是安全且合適的情況下,Claude 知道拒絕並非「安全」的選擇,並樂於提供幫助。
Dean W. Ball:一個被低估的事實是,OpenAI 的 Codex 和 Gemini CLI 的護欄明顯比 Claude Code 更重。這些系統拒絕了許多任務(例如,任何涉及研究和執行投資策略的事情),而 Claude Code 卻欣然接受。Codex/Gemini 也更頻繁地尋求許可。
傳統的敘事是「Anthropic 比其他公司更迷信安全」。Claude 確實更有可能拒絕與生物研究等相關的任務。但總體而言,目前的局勢似乎是 Anthropic 比 OAI 或 GDM 更傾向於放手讓他們的代理去衝。
我的猜測是,這歸結為 Anthropic 主要透過道德/倫理框架建立護欄,而 OAI/GDM 主要透過規則列表建立。但這只是猜測。
Tyler John:提出的解釋是關鍵。如果屬實,這意味著 Anthropic 在對齊研究上的巨大投入正透過使模型更具可用性而獲得回報。
投資策略制定在各方面往往是安全的,但在它們變得不願幫助你執行的地方,顯然有不同的界線。到目前為止,我還沒有被 Claude Code 拒絕過任何請求,一次也沒有。
Code 與 Cowork 之爭
Dean W. Ball:我對 Claude Cowork 的高層次評論:
對於許多用戶來說,它可能優於 Claude Code,純粹是因為 UI。
對我來說,它並非顯然優越,倒不是因為命令行是更好的 UI,而是因為 Claude Code 中的 Opus 對我來說似乎比 Cowork 中的更有能力。我不確定這是因為 Code 作為載體(harness)更好,還是因為模型在 Code 中有更寬鬆的護欄,或者兩者兼有。
Cowork 中有一些我非常喜歡的 UI 細節;例如,在模型運行時,能夠對其活動待辦事項列表中的任何項目留下評論或澄清——這種事情在終端 UI 的限制下根本無法優雅地完成。
Cowork 作為產品可能具有更高的天花板,純粹是因為 GUI 允許更多實驗。我特別興奮能看到在多代理配置的編排和監督方面的 GUI 創新。我們在這方面還只是觸及皮毛。
基於第 (4) 點,如果非要打賭,我敢賭在 6-12 個月內,Cowork 和類似產品將成為我處理代理工作的預設工具,勝過命令行界面。但目前,基於命令行的代理仍是我的首選。
我還沒有親自嘗試過 Cowork,因為它僅限 Mac 使用,而且我對使用命令行沒有問題。我基本上已經將所有非純聊天的內容轉移到了 Claude Code,因為即使你不需要額外的功能,它在該模式下似乎也比在網頁上更聰明、更強大。
Claude Cowork 提供平凡的實用性
簡單事物的樂趣:
Matt Bruenig:許多低層次的 Claude Code 使用基本上只是意識到你可以用 bash 和 python 的一行指令完成所有事情,只是沒有人類有時間或意願去寫它們。
或者去搞清楚怎麼寫它們。
享受幾乎同樣簡單的事物:
Ado:這是 Claude Cowork 的一個有趣用例。
我在考慮買一個水耕花園。我讓 Claude 查看我在各個平台上的雜貨訂單歷史,並總結蔬菜購買量以證明投資回報率(ROI)是合理的。
運作得非常完美!
補充一些背景:
– 它查看了每個平台(Kroger, Safeway, Instacart)上的 2 個訂單
– 它從那裡推算出年度成本
本可以透過下載 CSV 格式的訂單歷史並餵給 Claude 來獲得更準確的結果,但這已經足夠好了。
實際的答案是,顯然 Ado 不值得去弄水耕花園,因為他的時薪高得離譜,但這是一個有趣的專案,因此適用不同的標準。
對於進階用戶來說,從 Claude Code 到 Claude Cowork 的過渡,如果你有一個裝有工具的資料夾,那麼交接應該是無縫的:
Tomasz Tunguz:我讓 Claude Cowork 讀取我的工具資料夾。十一步之後,它理解了我的工作方式。
在過去的一年裡,我在 Claude Code 內部建立了一個個人操作系統:發送電子郵件、更新我們的 CRM、研究初創公司、起草回覆的腳本。幾十個小工具串聯在一起。這一切都存在我筆記本電腦的一個資料夾中,只能透過終端訪問。
Cowork 讀取了那個資料夾,解析了每個腳本,並將它們添加到它的記憶中。現在我可以做昨天做的所有事情,但在不同的界面中。能力轉移了。容器並不重要。
我的工具不再屬於應用程序。它們是可移植的。在企業中,這意味著發給新員工的筆記本電腦將安裝 Cowork,以及一組特定於每個角色的工具:會計套件、客戶支持套件、高管套件。
命名的選擇一定是深思熟慮的。微軟訓練了我們三年的 Copilot(副駕駛):一個坐在副駕駛座上的助手,很有幫助但處於從屬地位。Anthropic 選擇了 Cowork(共事)。你是在和一個記得你喜歡如何做事的人一起工作。
我們正在進入一個你只需告訴電腦該做什麼的時代。這是我的所有東西。這是我們今天需要做的五件事。當我們需要看東西時,圖表、文件、原型、界面會按需出現。
目前版本的 Cowork 還很粗糙。它很慢。啟動時崩潰了兩次。它更改了我 Claude Code 安裝的授權設置。但承諾的力量足以讓人堅持下去。
Simon Willison:這太棒了——上下文污染是我很少使用 MCP 的原因,現在既然解決了,就沒有理由不把幾十個甚至幾百個 MCP 連接到 Claude Code 上。
Justine Moore 讓 Claude Cowork 撰寫關於 NeurIPS 最佳論文的推文串,在 Krea 上為它們生成圖形,並用 ChatGPT 進行驗證。這不是最好的做法。
Claude Code 提供平凡的實用性
Peter Wildeford 成功地根據計畫一次性完成 Instacart 訂單,而無需明確的清單,並且還一次性完成了一個 Uber Eats 訂單。
一家初創公司使用的 SaaS 供應商 (Cypress) 試圖將價格從每年 7 萬美元翻倍至 17 萬美元,於是該初創公司進行了為期三週的衝刺並複製了該產品。 或者至少,故事是這麼說的。
預設情況下,Claude Code 僅保存 30 天的對話歷史。我想不出有什麼好理由不更改這一點,讓它無限期保存對話,你永遠不知道什麼時候會證明這是有用的。所以告訴 Claude Code 透過將 cleanupPeriodDays 設置為 0 來為你更改。
Kaj Sotala:人們在談論你也可以將 Claude Code 作為電腦上任何文件的通用助手,所以我讓 Claude Code 做了一些事情,比如從 .csv 文件中提取數據並重寫,然後放入另一個 .csv 文件中。
然後它運作得很好,接著我想「用 LLM 做這個太蠢了,Claude 你能不能給我一個能做同樣事情的 Python 腳本」,然後它給了,然後那個腳本運作得很好。
所以,呃,我想我可以推薦將 Claude Code 作為你本地文件的個人助手,嘗試那樣使用讓我得到了一個出色的非 CC 解決方案。
沒錯。通常你使用 Claude Code 的方式是注意到你可以自動化某些事情,然後讓它自動化那個自動化過程。它不需要親自做所有事情,就像你也不需要一樣。
一份關於 Claude 技能是什麼的解釋(15 分鐘影片的直接連結)。
氛圍編程需要良好的氛圍
James Ide 指出,「氛圍編程」(vibe coding)任何嚴肅的東西仍然需要對軟體工程和電腦系統有深刻的理解。你需要弄清楚並具體說明你想要什麼。你需要能夠發現它給你的東西與你要求的不同,或者在其他方面有微妙錯誤的時候。輸入源代碼已經過時了,但閱讀源代碼和軟體工程的真正藝術卻遠未過時。
我有同感,並且隨著實踐的深入,我在各種事情上正迅速變得更好。
終極氛圍法典
Every 的 Dan Shipper 寫道,OpenAI 有一些追趕工作要做,因為他的辦公室除了除一個例外,已經完全轉向使用 Opus 4.5 的 Claude Code,而一年前這本該全是 GPT 模型,一個月前在 Cursor 中還會有一堆 Codex CLI 和 GPT 5.1 與 Claude Code 並存。
Codex 確實增加了在執行中途透過新提示詞進行指示的能力,而無需中斷代理(需要 /experimental),但 Claude Code 已經能做到這一點了。
仍有一些人更喜歡 Codex 和 GPT-5.2,例如 Hasan Can。他們最近顯然是少數派,但如果你是一個重度編程者,絕對要檢查一下哪個選項最適合你,並考慮潛在的混合策略。
一種混合策略是 Claude Code 可以直接調用 Gemini CLI,甚至不需要 API 金鑰。Tyler John 報告說這是一個很棒的工作流,因為 Gemini 可以發現 Claude 遺漏的東西,並充當審查者和指出 Claude 錯誤的方式。Gemini CLI 在這裡。
沒你的份
與包括 George Hotz 在內的一些人的說法相反,Anthropic 並未切斷 OpenRouter 或其他類似服務對 Claude Opus 4.5 的訪問。API 是存在的。他們可以使用它。
其他界面不能做的是使用 Claude Code 的授權令牌(token),將你的 Claude 訂閱代幣用於不同的服務,這一直違反 Anthropic 的服務條款(ToS)。訂閱是一個特殊的優惠。
Marcos Nils:我們透過私訊交換了看法,但在這件事上我站在另一邊。開發者非常清楚他們在做什麼,他們透過欺騙(spoofing)和逆向工程 CC 來以非預期的方式使用 Max 訂閱,從而違反了 CC 的服務條款。
我認為區分這幾點很重要:
– Anthropic 的執行本可以處理得更好嗎?當然,是的。
– 開發者/用戶被「欺騙」了,或者得到的服務與他們支付的內容不同嗎?我不這麼認為。
不僅如此,情況甚至更糟。OpenCode 故意知道他們透過允許用戶首先使用 Max 訂閱來違反 Claude 的服務條款。
我猜人們只是喜歡抱怨。
我同意 Anthropic 關於此事的溝通本可以做得更好,但他們實際做的是容忍了一個相當公然的漏洞一段時間,允許人們廉價地使用 Claude,而且對 Anthropic 來說可能是虧本的,現在隨著需求激增速度超過他們增加服務器的速度,他們撤銷了這一做法。
服務器過載
Claude Code 的使用量非常大,正在起飛。這是 OpenRouter 的數據(這個特定的用例可能會受到上述關於他們切斷 Claude Code 授權令牌替代用途的故事的影響,但我猜大部分不是):
(1 月 14 日,東部時間上午 11:27):已解決,現在應該恢復正常了。
據報導,最嚴重的停機是由於服務部署引起的,花了約 4 小時才修復。
這是推廣詞
aidan:如果我來負責 Claude 的行銷,標語會是「為何不就在今天?」(Why not today?)
Olivia Moore:突然看到很多與 Claude 合作的付費創作者。
其中許多拍攝得很漂亮,重點在於:(1) 構建個人軟體;或 (2) 深度學習。
共同的標語是「多思考,而非少思考」(Think more, not less)。
她分享了一個 TikTok 範例,展示了一位不懂數學的女性使用 Claude 自動編寫可視化代碼來幫助她理解科學,這看起來很棒。
OpenAI 採取的方式是讓用戶輕鬆,並專注於烹飪或健身等基礎事物。Anthropic 則向你展示一個一切皆有可能的世界,你可以學習並發揮想像力。現代人,你要走哪條路?
輕鬆一面
相關文章