Google releases Gemma 4 open models

Hacker News·3 天前

Google 發佈了 Gemma 4 開放模型，為行動裝置與物聯網設備提供全新水平的智慧，並具備極高的運算與記憶體效率。

gemma 4

背景

Google 近期發布了新一代開放模型 Gemma 4，主打在行動裝置與物聯網設備上實現極高的運算與記憶體效率。此系列包含針對行動端優化的 E2B 與 E4B 微型模型，以及規模較大的 26B-A4B 混合專家模型（MoE）與 31B 稠密模型，並全面支援多模態輸入、工具調用與推理能力。

社群觀點

Hacker News 社群對 Gemma 4 的發布反應熱烈，特別是針對其在有限硬體資源下的性能表現。知名優化工具 Unsloth 的開發者 danielhanchen 指出，Gemma 4 的推理與思考能力令人驚艷，尤其是 2B 與 4B 的小模型在實際測試中展現了超乎預期的實力。社群成員普遍認為，這類高效能的小型模型將大幅改變本地端 AI 的應用場景，例如隱私優先的即時翻譯、照片圖庫的自動標籤與描述，以及個人筆記的結構化處理。

在技術實作層面，量化技術的進步成為討論焦點。許多使用者分享了利用 llama.cpp 搭配不同量化版本（如 UD-Q4_K_XL）在 Mac 或 NVIDIA 顯卡上運行的經驗。討論中提到，對於擁有 24GB 顯存的用戶，選擇 4-bit 量化的大型模型通常比全精度的微型模型更具效益。此外，Gemma 4 引入的「思考軌跡」功能也引起好奇，開發者提醒在使用時需注意特定的起始與結束標記，並調整溫度參數以獲得最佳效果。

然而，社群對於基準測試（Benchmark）的可靠性存在顯著分歧。部分資深開發者如 antirez 認為，官方過度強調 Elo 分數可能具有誤導性，因為在多項傳統基準測試中，Gemma 4 的大型模型並未全面超越 Qwen 3.5 等競爭對手。社群內對於 Lmarena 等人類評測平台的公正性也展開激烈辯論，有人擔憂這些平台容易被針對性優化，導致分數與實際體感脫節。儘管如此，多數人仍認同開放權重模型的進步速度極快，預計在一到兩年內，本地運行的模型就能滿足絕大多數日常任務，進而降低對雲端付費服務的依賴。

針對實際應用，不少使用者分享了將 Gemma 4 整合進工作流的嘗試。例如在法律文書處理中，結合視覺模型進行 OCR 辨識與表格提取，或是用於本地程式碼補全與郵件過濾。雖然目前在處理複雜的長篇 PDF 或高難度編程任務時，本地模型與頂尖雲端模型（如 Claude 或 GPT-4）仍有差距，但其 Apache 2.0 的授權條款與對語音輸入的原生支援，使其在行動端與隱私敏感領域展現出極強的競爭力。

延伸閱讀

在討論串中，開發者推薦了多項實用的本地 AI 工具與資源。Unsloth 團隊提供了針對 Gemma 4 優化的量化模型集合與安裝指南，並正開發更易於使用的 Windows 安裝程式。針對 OCR 與表格提取需求，有使用者推薦了輕量級的 GLM-OCR 模型，認為其在處理複雜版面時表現優異。此外，n8n 結合 Ollama 的自動化工作流，以及專為 PDF 處理設計的開源專案 opendataloader-pdf，也被視為構建本地 AI 應用的重要參考。對於關注基準測試真實性的讀者，留言中列舉了 LiveBench、FrontierMath 與 Kagi LLM Benchmark 等多個試圖避免訓練數據污染的私有測試平台。

https://deepmind.google/models/gemma/gemma-4/