Qwen2.5-35B-A3B:具備代理編碼能力的模型,現已全面開放

Hacker News·

AI 生成摘要

阿里巴巴雲發佈了 Qwen2.5-35B-A3B,這是一款開源的混合專家模型,針對具備代理能力的編碼任務進行了優化,兼具高效率與強大性能。

背景

阿里巴巴旗下的 Qwen 團隊近期發布了最新一代開源模型 Qwen3.6-35B-A3B,這款模型特別針對代理式編程(Agentic Coding)能力進行優化。作為 Qwen 系列的最新成員,該模型在維持強大性能的同時,致力於提供更開放的權重下載,讓開發者能在本地環境中部署具備高度邏輯推理與代碼生成能力的 AI 助手。

社群觀點

在 Hacker News 的討論中,社群對 Qwen 團隊能持續發布高品質的開源權重感到驚喜與欣慰。由於先前傳出該團隊有多位高階核心成員離職,包括林俊漾等關鍵人物的變動,加上市場傳聞其研發方向可能受到外部干預,不少開發者曾擔心 Qwen 系列的更新節奏會因此中斷。然而,這次 35B 模型的推出打破了疑慮,留言者普遍認為這證明了團隊在人才流失後仍保有強大的研發動能,且其性能表現甚至被預期能超越先前的 27B 版本。

對於這類開源模型的實用價值,社群展現了極高的期待。相較於目前主流的商業模型如 Claude 3.5 Sonnet 或 GPT 系列,開發者更看重 Qwen 這種不帶過度行銷包裝、沒有訂閱費用限制,且不會以「安全性」為由拒絕發布權重的純粹技術產出。特別是在金融、醫療等對數據隱私極其敏感的產業,這類中小型開源模型被視為構建客製化開發代理的最佳選擇。討論者指出,西方模型開發商除了 Mistral 之外,大多忽略了這塊需要本地部署、針對特定開發場景優化的市場,而 Qwen 的出現正好填補了這一缺口。

然而,硬體門檻依然是本地部署的一大挑戰。部分使用者提到,雖然 35B 的參數規模在性能上具有優勢,但對於僅擁有 36GB 記憶體的 Mac 使用者來說,在加載長文本上下文時會顯得捉襟見肘,因此社群也開始期待未來能推出更輕量化的 9B 版本。此外,也有評論感嘆目前的硬體市場缺乏性價比,若想流暢運行這類模型,消費者仍難以在有限預算內取得具備大容量統一記憶體的運算設備。在性能對比方面,雖然社群對其編程能力抱持樂觀態度,但仍有待實際測試來驗證其是否能真正與頂尖的商業閉源模型並駕齊驅,而非僅僅是基準測試數據上的領先。

延伸閱讀

Hacker News

相關文章

其他收藏 · 0

收藏夾