DeepSeek V4：性能逼近頂尖模型，價格僅為零頭

Hacker News·大約 20 小時前

DeepSeek 發布了其 V4 系列預覽版模型，具備龐大的參數規模與前所未有的成本效率，其價格遠低於 OpenAI 和 Anthropic 等主要競爭對手。

背景

科技博主 Simon Willison 近期介紹了中國 AI 實驗室 DeepSeek 發布的 V4 系列預覽模型，包含 DeepSeek-V4-Pro 與 Flash 兩款採用混合專家架構（MoE）的大型模型。這系列模型以極高的參數規模與低廉的定價策略引起關注，其中 Pro 版本擁有 1.6 兆總參數，並在推理效率與 KV 快取優化上取得顯著突破，試圖在維持開源權重的同時，挑戰 OpenAI 與 Anthropic 等一線廠商的領先地位。

社群觀點

在 Hacker News 的討論中，社群對於 DeepSeek V4 的評價呈現出對性價比的高度肯定，但同時也對隱私安全與評測標準抱持懷疑。許多開發者分享了實際應用的經驗，認為 Pro 版本的表現已能與 GPT-5.4 或 Claude Opus 4.6 等頂尖模型並駕齊驅，特別是在前端開發與程式碼審查等任務上，其產出品質足以應付日常原型開發。最令社群驚艷的是其極致的成本優勢，有使用者指出，在處理同樣規模的 TypeScript 代碼庫時，DeepSeek 的花費僅為 Claude 的百分之一，這種價格差距讓許多原本依賴高額訂閱制的專業用戶開始考慮轉向 API 接入模式。

然而，關於模型性能的穩定性與「思考過程」的品質，社群中也存在分歧。有用戶反映在試用過程中，模型展現出的推理邏輯顯得混亂，頻繁出現自我否定的語句，彷彿在推理過程中陷入崩潰。此外，長期以來被視為視覺模型基準的「鵜鶘測試」也遭到質疑，部分評論者認為這類特定圖像可能早已被納入訓練集或針對性優化，呼籲應開發更具新意且模型難以預測的評估指標，以避免評測結果失真。

隱私與數據安全是另一個爭論焦點。部分用戶對直接使用中國開發者的 API 感到擔憂，擔心輸入的敏感數據會被用於模型訓練或外洩。雖然有觀點認為開源代碼本就屬於公共領域，且 DeepSeek 提供的低廉價格可視為一種數據稅的補償，但仍有開發者堅持尋求在 AWS Bedrock 等受信任的基礎設施上運行，以確保數據合規。儘管目前 DeepSeek 的定價包含推廣期的折扣成分，但社群普遍共識是，隨著硬體效率提升與國產晶片的普及，這種低價競爭將迫使一線廠商重新審視其定價策略，進而推動整個 AI 產業的成本結構轉型。

延伸閱讀

在討論串中，使用者提到了幾個值得關注的工具與資源。對於希望在本地端運行模型的用戶，可以關注 Unsloth 團隊在 Hugging Face 上發布的量化版本。在推理服務供應商方面，除了官方 API，OpenRouter 與 AWS Bedrock 也是被提及的替代方案。此外，針對編碼場景，有用戶推薦使用 Opencode Go 搭配 pi.dev 的組合，這類工具能整合多種模型（如 DeepSeek V4 與 Kimi K2.6）進行開發工作。

— Hacker News

你的個人知識庫

DeepSeek V4：性能逼近頂尖模型，價格僅為零頭

背景

社群觀點

延伸閱讀