Anthropic 於 3 月 6 日悄然將快取存留時間從 1 小時降至 5 分鐘
對 Claude Code 會話數據的分析顯示,Anthropic 在 2026 年 3 月初悄然將提示快取存留時間從 1 小時縮短至 5 分鐘,導致用戶成本增加 20% 至 32%,並造成配額消耗大幅飆升。
背景
近期在 GitHub 與 Hacker News 社群引發熱議的一項數據分析顯示,Anthropic 疑似在 2026 年 3 月初悄悄調整了其 API 的快取存活時間(TTL),將原本預設的一小時大幅縮短至五分鐘。這項變動直接導致 Claude Code 使用者的快取失效頻率增加,進而造成配額消耗過快與使用成本上升,部分訂閱用戶反映其配額在未改變使用習慣的情況下,因頻繁重新寫入快取而迅速耗盡。
社群觀點
針對這項疑似「降級」的變動,社群討論呈現出多種面向的解讀。部分開發者認為這反映了 Anthropic 在基礎設施壓力下的應急反應,特別是這段時間正值該公司宣布高峰時段限制的時期。有觀點指出,縮短 TTL 可能是為了緩解伺服器負載,但這種「憑感覺調整基礎設施」的做法,卻讓依賴穩定服務的專業用戶感到信任崩潰。開發者普遍對這種缺乏透明度的變動感到不滿,認為這不僅是技術問題,更是一種商業誠信的流失,甚至有評論諷刺 Anthropic 正在進行某種程度的「割韭菜」行為,透過隱蔽的技術手段增加用戶支出。
在技術細節的討論上,社群對於快取策略有著不同的見解。有留言分析指出,對於長期的編碼協作任務,五分鐘的 TTL 極其不友善,因為任何短暫的思考或查閱資料都會導致上下文過期,被迫以高昂的寫入價格重新上傳。然而,也有資深用戶提出不同看法,認為一小時與五分鐘的快取成本差異極大,對於大規模基礎設施而言,粗放的快取策略確實難以持續,Anthropic 可能是在評估整體負載後做出的刻意選擇。
此外,這場討論也引發了用戶對不同模型服務商的橫向比較。不少原本支持 Claude 的工程師表示,近期感覺到模型表現有所下滑,甚至在處理邏輯問題時出現退步,這促使部分用戶轉向使用 Codex 或 ChatGPT。討論中也觸及了更深層的產業憂慮,有評論者擔憂 AI 產業正走向「去技術化」與「高度壟斷」的未來,當初標榜開放與倫理的公司,在面對成本壓力與市場競爭時,依然會選擇犧牲用戶利益並建立封閉的護城河。這種對「AI 服務品質不穩定」的集體焦慮,正逐漸取代最初對技術突破的驚艷感。
延伸閱讀
在討論串中,有使用者提到 Codex 在近期表現優異,並建議開發者可以嘗試將開源的 Codex 工具與 Claude 或 Amazon Bedrock 結合使用,以尋求更穩定的開發體驗。此外,GitHub 上的相關 Issue 編號 #45756 亦提供了關於配額計算係數的進一步技術追蹤。