newsence
通用 CLAUDE.md:減少 Claude 輸出 Token 達 63%

通用 CLAUDE.md:減少 Claude 輸出 Token 達 63%

Hacker News·6 天前

一個全新的開源專案提供了一個可直接套用的 CLAUDE.md 檔案,無需更改程式碼即可顯著減少 Claude 的輸出冗餘與成本。它針對討好式回覆與格式雜訊進行優化,為開發者提供簡潔且高資訊含量的回應。

背景

隨著 Claude Code 等開發工具普及,開發者發現模型預設的輸出往往過於冗長,包含大量的客觀陳述、重複背景與禮貌性廢話,這不僅拖慢開發節奏,也增加了輸出代幣的成本。GitHub 專案 Universal Claude.md 提出了一種解決方案,透過在專案根目錄放置一個設定檔,強制模型遵循精簡原則,宣稱能在不損失資訊的前提下減少約 63% 的輸出代幣消耗。

社群觀點

針對這項工具,Hacker News 社群展開了多維度的討論。部分開發者對此表示歡迎,認為這解決了模型「討好型人格」與過度解釋的痛點,特別是在處理重複性高的程式碼審查或簡單修復時,精簡的輸出能顯著提升閱讀效率。然而,許多資深用戶對此持保留態度,主要的疑慮在於「輸出代幣」與「模型推理能力」之間的權衡。有觀點指出,根據 Karpathy 等專家的研究,大型語言模型的推理品質往往與其輸出的長度呈正相關,若強行要求模型先給答案再進行推理,可能會因為自迴歸模型的特性,導致模型在缺乏思考空間的情況下鎖定錯誤答案,隨後的推理僅變成一種確認偏誤的補償。

此外,關於成本節省的實際效益也引發了激烈辯論。有留言引用數據指出,在真實的程式開發場景中,輸入代幣佔據了總量的九成以上,輸出代幣僅佔約 4%。雖然輸出代幣的單價較高,但在 Prompt Caching 技術普及後,輸入成本已大幅下降,這使得減少輸出的經濟效益變得相對有限。更重要的是,CLAUDE.md 檔案本身會佔用每一則訊息的輸入空間,對於對話次數多但單次輸出短的場景,這種做法反而可能導致總代幣消耗增加。

社群中也有人分享了更進階的自動化管理思路。例如有開發者開發了名為 handoff 的技能,在對話接近脈絡限制時,自動生成一份總結進度的 Markdown 文件,這比單純壓抑模型輸出更能維持長期的專案連貫性。同時,也有用戶提醒,過度追求精簡可能會犧牲模型的「準確度」,因為冗長的解釋有時能幫助開發者理解模型的思考邏輯,避免在複雜的 Agent 循環中迷失方向。整體而言,社群傾向於將此類工具視為一種特定場景下的優化手段,而非萬靈丹,並建議開發者應根據任務的複雜度靈活調整規則。

延伸閱讀

在討論過程中,社群成員分享了數個能與此工具搭配或作為替代方案的資源。Headroom 是一個開源代理工具,能自動壓縮與 Claude 之間的通訊脈絡;RTK 則是一個 Rust 編寫的 CLI 代理,專門用於壓縮 shell 輸出(如 git 或 npm 日誌),最高可減少 90% 的脈絡佔用。此外,MemStack 提供了持久化記憶體功能,避免模型在每次對話時重複讀取整個程式庫。對於想要實作自動化進度紀錄的開發者,社群也提供了一個名為 handoff.md 的 Gist 範本,用於在對話結束前生成結構化的開發日誌。

https://github.com/drona23/claude-token-efficient