newsence
Anthropic 賦予 Claude Code 更多控制權,但仍保持安全限制

Anthropic 賦予 Claude Code 更多控制權,但仍保持安全限制

Techcrunch·12 天前

Anthropic 為 Claude Code 推出的全新自動模式讓 AI 能以更少的授權執行任務,反映出業界正轉向更具自主性的工具,並透過內建防護機制在速度與安全之間取得平衡。

對於使用 AI 的開發者來說,目前的「氛圍編碼」(vibe coding)若非得時刻盯著每一個動作,就是得冒著讓模型脫韁運行的風險。Anthropic 表示,其對 Claude 的最新更新旨在消除這種抉擇,讓 AI 在一定限制下,自行決定哪些動作是安全的。

此舉反映了整個行業的更廣泛轉變,因為 AI 工具越來越多地被設計為無需等待人類批准即可採取行動。挑戰在於平衡速度與控制:過多的護欄會拖慢速度,而過少則可能使系統變得危險且不可預測。Anthropic 新推出的「自動模式」(auto mode)目前處於研究預覽階段(意即可用於測試但尚未成為正式產品),是其在兩者之間取得平衡的最新嘗試。

自動模式使用 AI 安全防護機制在執行前審查每個動作,檢查是否存在用戶未要求的風險行為,以及是否存在指令注入(prompt injection)的跡象——這是一種將惡意指令隱藏在 AI 處理的內容中,導致其採取非預期行動的攻擊類型。任何安全的動作都將自動執行,而有風險的動作則會被攔截。這本質上是 Claude Code 現有「dangerously-skip-permissions」指令的延伸,該指令將所有決策權交給 AI,但現在在其之上增加了一層安全防護。

這項功能建立在 GitHub 和 OpenAI 等公司推出的一波自主編碼工具基礎之上,這些工具可以代表開發者執行任務。但它更進一步,將「何時向用戶請求許可」的決定權從用戶轉移到了 AI 本身。

Anthropic 尚未詳細說明其安全層用於區分安全與風險動作的具體標準——開發者在廣泛採用此功能之前,可能希望對此有更深入的了解。(TechCrunch 已聯繫該公司以獲取更多相關資訊。)

自動模式是在 Anthropic 推出 Claude Code Review(旨在於進入代碼庫前捕捉錯誤的自動代碼審查工具)以及 Dispatch for Cowork(允許用戶將任務發送給 AI 代理以代表其處理工作)之後推出的。

自動模式將在未來幾天內向企業版和 API 用戶推出。該公司表示,目前該功能僅適用於 Claude Sonnet 4.6 和 Opus 4.6,並建議在「隔離環境」(與生產系統分開的沙盒設置)中使用新功能,以在發生錯誤時限制潛在損害。

https://techcrunch.com/2026/03/24/anthropic-hands-claude-code-more-control-but-keeps-it-on-a-leash/