Opus 4.7 對比 4.6 的 Token 通膨率約為 45%

Hacker News·大約 5 小時前

AI 生成摘要

社群匿名請求的代幣比較顯示，Opus 4.7 與 4.6 在處理真實輸入時存在差異，其代幣通膨率大約為 45%。

背景

近期 Anthropic 發布了新一代模型 Claude 3.7 Opus（在討論中常被稱為 4.7），然而社群透過 Token 成本計算工具發現，在處理相同的輸入內容時，新版模型的 Token 消耗量相較於前代 3.6 版本（討論中稱為 4.6）大幅增加了約 45%。這項發現引發了開發者對於模型分詞器（Tokenizer）變動、使用成本激增以及模型實際效能表現的廣泛討論。

社群觀點

針對 Token 消耗量激增的現象，社群首先關注的是技術層面的變動。有使用者指出，這類「Token 通膨」在短提示詞（Prompt）的情況下甚至可能達到兩倍以上的差異。雖然有人猜測這可能是因為分詞器改變了編碼方式，導致原本一個 Token 就能表達的內容現在需要多個 Token，但也有觀點認為，單純比較輸入端的 Token 數量並不全面。部分開發者主張，更聰明的模型理論上能以更簡潔的輸出完成任務，或減少對話輪次，從而抵銷輸入成本的增加；然而，初步的實測回饋卻顯示新模型在整體運作上似乎更加「飢渴」，並未如預期般節省總量。

在模型效能與實用性方面，社群出現了兩極化的評價。部分用戶對新模型的穩定性表示擔憂，認為長對話中模型更容易偏離軌道，甚至有評論直言新模型在某些安全過濾機制下顯得過於「笨拙」，例如在執行網路安全相關任務或解決簡單的益智遊戲（如紐約時報的 Connections）時，常因過度觸發安全機制而拒絕回答。對此，來自 Anthropic 團隊的成員 Boris 解釋，這是因為新模型不再需要舊版所需的「提醒詞」，若開發者未更新工具鏈而繼續餵入舊的提醒詞，反而會導致模型過度反應。儘管如此，仍有使用者反映新模型的表現極度不穩定，有時能精準完成任務，有時卻表現得像過時的舊模型。

從商業與產業趨勢來看，社群普遍感受到 AI 服務成本正在攀升。許多開發者認為，隨著補貼期結束，AI 公司正透過調整計費結構與增加 Token 消耗來提高營收，這對於預算有限的獨立開發者或新創公司來說是沉重的負擔。有人預測，未來高品質的 AI 工具將逐漸轉向高價的企業級訂閱制，這可能導致技術的「去民主化」，讓一般大眾只能使用效能較差的本地模型。這種趨勢也促使開發者開始尋求替代方案，例如採用雙模型架構來平衡成本，或將目光轉向開源模型（如 Meta 的 Llama）以及中國廠商推出的競爭產品（如 Qwen、Kimi），認為這些開源或低成本的選項將在未來對 Anthropic 等巨頭構成實質威脅。

你的個人知識庫

Opus 4.7 對比 4.6 的 Token 通膨率約為 45%

背景

社群觀點

延伸閱讀