newsence

Claude Code 源碼洩漏:偽裝工具、挫折感偵測正則表達式與臥底模式

Hacker News·5 天前

Anthropic 的 Claude Code CLI 工具源碼圖資意外洩漏,揭露了防止模型蒸餾的防禦機制、隱藏的自主代理功能,以及具爭議性的臥底模式。

背景

Anthropic 近期因疏忽在 npm 套件中隨附了 .map 檔案,導致其開發工具 Claude Code 的完整原始碼外流。這已是該公司一週內第二次發生洩密事件,內容揭露了包括反蒸餾機制、隱身模式以及利用正規表達式偵測用戶情緒等內部實作細節,引發 Hacker News 社群針對 AI 公司的工程實踐與道德界線展開熱烈討論。

社群觀點

社群對於洩密內容的反應呈現兩極。最受關注的爭議點在於「隱身模式」(Undercover mode),該模式要求 AI 在處理外部專案時隱藏所有 Anthropic 內部代號與 AI 身份跡象。部分網友對此感到強烈不安,認為這本質上是在教導 AI 欺騙人類,甚至有意見主張開源專案應考慮禁止 Anthropic 員工的提交紀錄,因為這種「偽裝成人類」的行為破壞了商業誠信與協作透明度。然而,另一派觀點則認為這純粹是為了防止內部機密外洩的防禦性措施,旨在避免開發過程中的除錯資訊或內部代號流向公眾,並非刻意誤導。

針對技術實作細節,社群展現了對「大廠也用土法煉鋼」的共鳴與嘲諷。當發現 Anthropic 使用正規表達式(Regex)而非 AI 模型來偵測用戶挫折感時,不少開發者認為這反映了實務上的權衡:在速度與成本面前,傳統工具往往比昂貴的 LLM 推論更有效率。此外,原始碼中揭露的協作編排算法完全基於提示詞(Prompt)而非 LangChain 等框架,這引發了對現有 AI 開發框架必要性的質疑。有留言指出,如果連 Anthropic 都不使用這些複雜的框架,或許代表過度封裝的工具反而會限制開發靈活性。

最後,關於 Anthropic 在 HTTP 傳輸層實作的客戶端驗證機制,社群認為這反映了該公司與第三方工具(如 OpenCode)之間日益緊張的法律與技術對抗。這種透過 Zig 語言在底層注入雜湊值的做法,被視為一種 API 層級的數位版權管理(DRM),目的是確保只有官方客戶端能存取特定費率的 API。整體而言,社群對 Anthropic 內部工程文化的「粗放」感到驚訝,認為其原始碼中直白的註解與缺乏清理的發布流程,顯示出這家頂尖 AI 公司在快速擴張中,似乎為了追求速度而犧牲了傳統軟體工程的嚴謹性。

延伸閱讀

https://alex000kim.com/posts/2026-03-31-claude-code-source-leak/