Opus 4.7 對比 4.6 的 Token 通膨率約為 45%

Hacker News·

AI 生成摘要

社群匿名請求的代幣比較顯示,Opus 4.7 與 4.6 在處理真實輸入時存在差異,其代幣通膨率大約為 45%。

背景

近期 Anthropic 發布了新一代模型 Claude 3.7 Opus(在討論中常被稱為 4.7),然而社群透過 Token 成本計算工具發現,在處理相同的輸入內容時,新版模型的 Token 消耗量相較於前代 3.6 版本(討論中稱為 4.6)大幅增加了約 45%。這項發現引發了開發者對於模型分詞器(Tokenizer)變動、使用成本激增以及模型實際效能表現的廣泛討論。

社群觀點

針對 Token 消耗量激增的現象,社群首先關注的是技術層面的變動。有使用者指出,這類「Token 通膨」在短提示詞(Prompt)的情況下甚至可能達到兩倍以上的差異。雖然有人猜測這可能是因為分詞器改變了編碼方式,導致原本一個 Token 就能表達的內容現在需要多個 Token,但也有觀點認為,單純比較輸入端的 Token 數量並不全面。部分開發者主張,更聰明的模型理論上能以更簡潔的輸出完成任務,或減少對話輪次,從而抵銷輸入成本的增加;然而,初步的實測回饋卻顯示新模型在整體運作上似乎更加「飢渴」,並未如預期般節省總量。

在模型效能與實用性方面,社群出現了兩極化的評價。部分用戶對新模型的穩定性表示擔憂,認為長對話中模型更容易偏離軌道,甚至有評論直言新模型在某些安全過濾機制下顯得過於「笨拙」,例如在執行網路安全相關任務或解決簡單的益智遊戲(如紐約時報的 Connections)時,常因過度觸發安全機制而拒絕回答。對此,來自 Anthropic 團隊的成員 Boris 解釋,這是因為新模型不再需要舊版所需的「提醒詞」,若開發者未更新工具鏈而繼續餵入舊的提醒詞,反而會導致模型過度反應。儘管如此,仍有使用者反映新模型的表現極度不穩定,有時能精準完成任務,有時卻表現得像過時的舊模型。

從商業與產業趨勢來看,社群普遍感受到 AI 服務成本正在攀升。許多開發者認為,隨著補貼期結束,AI 公司正透過調整計費結構與增加 Token 消耗來提高營收,這對於預算有限的獨立開發者或新創公司來說是沉重的負擔。有人預測,未來高品質的 AI 工具將逐漸轉向高價的企業級訂閱制,這可能導致技術的「去民主化」,讓一般大眾只能使用效能較差的本地模型。這種趨勢也促使開發者開始尋求替代方案,例如採用雙模型架構來平衡成本,或將目光轉向開源模型(如 Meta 的 Llama)以及中國廠商推出的競爭產品(如 Qwen、Kimi),認為這些開源或低成本的選項將在未來對 Anthropic 等巨頭構成實質威脅。

延伸閱讀

  • Claude Code 更新說明:針對 Opus 3.7 在舊版工具中過度觸發安全警告的修復建議。
  • Qwen 2.5-1M:與 Anthropic 發布會撞期的競爭模型,提供長文本處理能力。
  • NYT Connections 拒絕案例:社群討論中提到的模型因安全機制拒絕處理簡單遊戲的實例。

Hacker News

相關文章

其他收藏 · 0

收藏夾