儘管中度使用，Pro Max 5x 配額仍於 1.5 小時內耗盡

Hacker News·大約 5 小時前

原文

我發現在 Pro Max 5x 計畫中，儘管只是中度使用，配額卻在 1.5 小時內耗盡。調查顯示原因可能是快取讀取權杖被以全額計算速率限制，導致提示快取在配額計算上完全失去優勢。

github.com

45756

背景

這起爭議源於一名 Claude Pro Max 5x 方案用戶在 GitHub 上提交的臭蟲報告。該用戶發現，儘管在重置配額後僅進行了中等強度的開發工作，其配額卻在短短 1.5 小時內耗盡，與過往的使用經驗嚴重不符。經過數據分析，用戶質疑 Anthropic 的計費邏輯存在瑕疵，特別是快取讀取（cache_read）令牌疑似被以全額費率計入速率限制，導致快取機制在節省配額上完全失效。

社群觀點

Hacker News 的討論社群對此展現出高度的共鳴與不滿，許多開發者反映自己也遇到了類似的配額異常消耗問題。社群普遍認為，Anthropic 在計費透明度上表現極差，用戶難以理解自己的訂閱配額究竟是如何被計算的。有留言指出，這種計費不透明的現象不僅出現在高階方案，連低階方案的用戶也感受到配額縮水，甚至出現提問一次就消耗掉 15% 配額的極端情況。這種對測量標準的不信任感，正促使部分忠實用戶考慮取消訂閱，轉向更具透明度或更慷慨的競爭對手。

針對 Anthropic 官方在 GitHub 上的回應，社群表現出強烈的質疑與憤怒。官方將快取存留時間（TTL）從一小時縮短至五分鐘，並聲稱此舉是為了幫用戶節省成本，但開發者透過實際數據反駁了這種說法。社群成員批評官方的回應充滿了「AI 生成感」，不僅邏輯不通，甚至有「煤氣燈效應」（gaslighting）的嫌疑，試圖掩蓋背後可能的運算資源短缺問題。這種關閉討論串且不願正面解決問題的態度，被視為對專業用戶需求的漠視。

此外，討論中也觸及了 AI 產業普遍面臨的擴展困境。有觀點認為，不只是 Anthropic，連 GitHub Copilot 也出現了難以理解的速率限制與計費變動，這反映出各大 AI 公司在面對激增的運算需求時，正掙扎於如何平衡成本與服務品質。在這種背景下，社群開始出現轉向開源模型或更穩定平台的趨勢。部分用戶分享了轉向 Codex 或結合 GPT-5.4 與開源工具的經驗，認為開源方案在自定義與成本控制上更具優勢，能避免陷入這種由單一廠商掌控且規則隨時變動的「幻滅谷地」。

延伸閱讀

在討論串中，開發者們提到了一些可替代的工具與平台，包括開源的 Codex 系統，以及被認為在目前工作流中表現優異的 GPT-5.4 搭配 Swival (https://swival.dev) 的組合。這些資源被視為在 Claude 配額機制不穩定時的有效替代方案。

https://github.com/anthropics/claude-code/issues/45756