儘管中度使用,Pro Max 5x 配額仍於 1.5 小時內耗盡

儘管中度使用,Pro Max 5x 配額仍於 1.5 小時內耗盡

Hacker News·大約 5 小時前

我發現在 Pro Max 5x 計畫中,儘管只是中度使用,配額卻在 1.5 小時內耗盡。調查顯示原因可能是快取讀取權杖被以全額計算速率限制,導致提示快取在配額計算上完全失去優勢。

背景

這起爭議源於一名 Claude Pro Max 5x 方案用戶在 GitHub 上提交的臭蟲報告。該用戶發現,儘管在重置配額後僅進行了中等強度的開發工作,其配額卻在短短 1.5 小時內耗盡,與過往的使用經驗嚴重不符。經過數據分析,用戶質疑 Anthropic 的計費邏輯存在瑕疵,特別是快取讀取(cache_read)令牌疑似被以全額費率計入速率限制,導致快取機制在節省配額上完全失效。

社群觀點

Hacker News 的討論社群對此展現出高度的共鳴與不滿,許多開發者反映自己也遇到了類似的配額異常消耗問題。社群普遍認為,Anthropic 在計費透明度上表現極差,用戶難以理解自己的訂閱配額究竟是如何被計算的。有留言指出,這種計費不透明的現象不僅出現在高階方案,連低階方案的用戶也感受到配額縮水,甚至出現提問一次就消耗掉 15% 配額的極端情況。這種對測量標準的不信任感,正促使部分忠實用戶考慮取消訂閱,轉向更具透明度或更慷慨的競爭對手。

針對 Anthropic 官方在 GitHub 上的回應,社群表現出強烈的質疑與憤怒。官方將快取存留時間(TTL)從一小時縮短至五分鐘,並聲稱此舉是為了幫用戶節省成本,但開發者透過實際數據反駁了這種說法。社群成員批評官方的回應充滿了「AI 生成感」,不僅邏輯不通,甚至有「煤氣燈效應」(gaslighting)的嫌疑,試圖掩蓋背後可能的運算資源短缺問題。這種關閉討論串且不願正面解決問題的態度,被視為對專業用戶需求的漠視。

此外,討論中也觸及了 AI 產業普遍面臨的擴展困境。有觀點認為,不只是 Anthropic,連 GitHub Copilot 也出現了難以理解的速率限制與計費變動,這反映出各大 AI 公司在面對激增的運算需求時,正掙扎於如何平衡成本與服務品質。在這種背景下,社群開始出現轉向開源模型或更穩定平台的趨勢。部分用戶分享了轉向 Codex 或結合 GPT-5.4 與開源工具的經驗,認為開源方案在自定義與成本控制上更具優勢,能避免陷入這種由單一廠商掌控且規則隨時變動的「幻滅谷地」。

延伸閱讀

在討論串中,開發者們提到了一些可替代的工具與平台,包括開源的 Codex 系統,以及被認為在目前工作流中表現優異的 GPT-5.4 搭配 Swival (https://swival.dev) 的組合。這些資源被視為在 Claude 配額機制不穩定時的有效替代方案。

https://github.com/anthropics/claude-code/issues/45756