通用 CLAUDE.md：減少 Claude 輸出 Token 達 63%

Hacker News·6 天前

原文

一個全新的開源專案提供了一個可直接套用的 CLAUDE.md 檔案，無需更改程式碼即可顯著減少 Claude 的輸出冗餘與成本。它針對討好式回覆與格式雜訊進行優化，為開發者提供簡潔且高資訊含量的回應。

github.com

claude token efficient

背景

隨著 Claude Code 等開發工具普及，開發者發現模型預設的輸出往往過於冗長，包含大量的客觀陳述、重複背景與禮貌性廢話，這不僅拖慢開發節奏，也增加了輸出代幣的成本。GitHub 專案 Universal Claude.md 提出了一種解決方案，透過在專案根目錄放置一個設定檔，強制模型遵循精簡原則，宣稱能在不損失資訊的前提下減少約 63% 的輸出代幣消耗。

社群觀點

針對這項工具，Hacker News 社群展開了多維度的討論。部分開發者對此表示歡迎，認為這解決了模型「討好型人格」與過度解釋的痛點，特別是在處理重複性高的程式碼審查或簡單修復時，精簡的輸出能顯著提升閱讀效率。然而，許多資深用戶對此持保留態度，主要的疑慮在於「輸出代幣」與「模型推理能力」之間的權衡。有觀點指出，根據 Karpathy 等專家的研究，大型語言模型的推理品質往往與其輸出的長度呈正相關，若強行要求模型先給答案再進行推理，可能會因為自迴歸模型的特性，導致模型在缺乏思考空間的情況下鎖定錯誤答案，隨後的推理僅變成一種確認偏誤的補償。

此外，關於成本節省的實際效益也引發了激烈辯論。有留言引用數據指出，在真實的程式開發場景中，輸入代幣佔據了總量的九成以上，輸出代幣僅佔約 4%。雖然輸出代幣的單價較高，但在 Prompt Caching 技術普及後，輸入成本已大幅下降，這使得減少輸出的經濟效益變得相對有限。更重要的是，CLAUDE.md 檔案本身會佔用每一則訊息的輸入空間，對於對話次數多但單次輸出短的場景，這種做法反而可能導致總代幣消耗增加。

社群中也有人分享了更進階的自動化管理思路。例如有開發者開發了名為 handoff 的技能，在對話接近脈絡限制時，自動生成一份總結進度的 Markdown 文件，這比單純壓抑模型輸出更能維持長期的專案連貫性。同時，也有用戶提醒，過度追求精簡可能會犧牲模型的「準確度」，因為冗長的解釋有時能幫助開發者理解模型的思考邏輯，避免在複雜的 Agent 循環中迷失方向。整體而言，社群傾向於將此類工具視為一種特定場景下的優化手段，而非萬靈丹，並建議開發者應根據任務的複雜度靈活調整規則。

延伸閱讀

在討論過程中，社群成員分享了數個能與此工具搭配或作為替代方案的資源。Headroom 是一個開源代理工具，能自動壓縮與 Claude 之間的通訊脈絡；RTK 則是一個 Rust 編寫的 CLI 代理，專門用於壓縮 shell 輸出（如 git 或 npm 日誌），最高可減少 90% 的脈絡佔用。此外，MemStack 提供了持久化記憶體功能，避免模型在每次對話時重複讀取整個程式庫。對於想要實作自動化進度紀錄的開發者，社群也提供了一個名為 handoff.md 的 Gist 範本，用於在對話結束前生成結構化的開發日誌。

https://github.com/drona23/claude-token-efficient