Anthropic 賦予 Claude Code 更多控制權，但仍保持安全限制

Techcrunch·12 天前

Anthropic 為 Claude Code 推出的全新自動模式讓 AI 能以更少的授權執行任務，反映出業界正轉向更具自主性的工具，並透過內建防護機制在速度與安全之間取得平衡。

對於使用 AI 的開發者來說，目前的「氛圍編碼」（vibe coding）若非得時刻盯著每一個動作，就是得冒著讓模型脫韁運行的風險。Anthropic 表示，其對 Claude 的最新更新旨在消除這種抉擇，讓 AI 在一定限制下，自行決定哪些動作是安全的。

此舉反映了整個行業的更廣泛轉變，因為 AI 工具越來越多地被設計為無需等待人類批准即可採取行動。挑戰在於平衡速度與控制：過多的護欄會拖慢速度，而過少則可能使系統變得危險且不可預測。Anthropic 新推出的「自動模式」（auto mode）目前處於研究預覽階段（意即可用於測試但尚未成為正式產品），是其在兩者之間取得平衡的最新嘗試。

自動模式使用 AI 安全防護機制在執行前審查每個動作，檢查是否存在用戶未要求的風險行為，以及是否存在指令注入（prompt injection）的跡象——這是一種將惡意指令隱藏在 AI 處理的內容中，導致其採取非預期行動的攻擊類型。任何安全的動作都將自動執行，而有風險的動作則會被攔截。這本質上是 Claude Code 現有「dangerously-skip-permissions」指令的延伸，該指令將所有決策權交給 AI，但現在在其之上增加了一層安全防護。

這項功能建立在 GitHub 和 OpenAI 等公司推出的一波自主編碼工具基礎之上，這些工具可以代表開發者執行任務。但它更進一步，將「何時向用戶請求許可」的決定權從用戶轉移到了 AI 本身。

Anthropic 尚未詳細說明其安全層用於區分安全與風險動作的具體標準——開發者在廣泛採用此功能之前，可能希望對此有更深入的了解。（TechCrunch 已聯繫該公司以獲取更多相關資訊。）

自動模式是在 Anthropic 推出 Claude Code Review（旨在於進入代碼庫前捕捉錯誤的自動代碼審查工具）以及 Dispatch for Cowork（允許用戶將任務發送給 AI 代理以代表其處理工作）之後推出的。

自動模式將在未來幾天內向企業版和 API 用戶推出。該公司表示，目前該功能僅適用於 Claude Sonnet 4.6 和 Opus 4.6，並建議在「隔離環境」（與生產系統分開的沙盒設置）中使用新功能，以在發生錯誤時限制潛在損害。

https://techcrunch.com/2026/03/24/anthropic-hands-claude-code-more-control-but-keeps-it-on-a-leash/