Anthropic 於 3 月 6 日悄然將快取存留時間從 1 小時降至 5 分鐘

Hacker News·大約 7 小時前

原文

對 Claude Code 會話數據的分析顯示，Anthropic 在 2026 年 3 月初悄然將提示快取存留時間從 1 小時縮短至 5 分鐘，導致用戶成本增加 20% 至 32%，並造成配額消耗大幅飆升。

github.com

46829

背景

近期在 GitHub 與 Hacker News 社群引發熱議的一項數據分析顯示，Anthropic 疑似在 2026 年 3 月初悄悄調整了其 API 的快取存活時間（TTL），將原本預設的一小時大幅縮短至五分鐘。這項變動直接導致 Claude Code 使用者的快取失效頻率增加，進而造成配額消耗過快與使用成本上升，部分訂閱用戶反映其配額在未改變使用習慣的情況下，因頻繁重新寫入快取而迅速耗盡。

社群觀點

針對這項疑似「降級」的變動，社群討論呈現出多種面向的解讀。部分開發者認為這反映了 Anthropic 在基礎設施壓力下的應急反應，特別是這段時間正值該公司宣布高峰時段限制的時期。有觀點指出，縮短 TTL 可能是為了緩解伺服器負載，但這種「憑感覺調整基礎設施」的做法，卻讓依賴穩定服務的專業用戶感到信任崩潰。開發者普遍對這種缺乏透明度的變動感到不滿，認為這不僅是技術問題，更是一種商業誠信的流失，甚至有評論諷刺 Anthropic 正在進行某種程度的「割韭菜」行為，透過隱蔽的技術手段增加用戶支出。

在技術細節的討論上，社群對於快取策略有著不同的見解。有留言分析指出，對於長期的編碼協作任務，五分鐘的 TTL 極其不友善，因為任何短暫的思考或查閱資料都會導致上下文過期，被迫以高昂的寫入價格重新上傳。然而，也有資深用戶提出不同看法，認為一小時與五分鐘的快取成本差異極大，對於大規模基礎設施而言，粗放的快取策略確實難以持續，Anthropic 可能是在評估整體負載後做出的刻意選擇。

此外，這場討論也引發了用戶對不同模型服務商的橫向比較。不少原本支持 Claude 的工程師表示，近期感覺到模型表現有所下滑，甚至在處理邏輯問題時出現退步，這促使部分用戶轉向使用 Codex 或 ChatGPT。討論中也觸及了更深層的產業憂慮，有評論者擔憂 AI 產業正走向「去技術化」與「高度壟斷」的未來，當初標榜開放與倫理的公司，在面對成本壓力與市場競爭時，依然會選擇犧牲用戶利益並建立封閉的護城河。這種對「AI 服務品質不穩定」的集體焦慮，正逐漸取代最初對技術突破的驚艷感。

延伸閱讀

在討論串中，有使用者提到 Codex 在近期表現優異，並建議開發者可以嘗試將開源的 Codex 工具與 Claude 或 Amazon Bedrock 結合使用，以尋求更穩定的開發體驗。此外，GitHub 上的相關 Issue 編號 #45756 亦提供了關於配額計算係數的進一步技術追蹤。

https://github.com/anthropics/claude-code/issues/46829