Prompt API:為開發者在 Chrome 瀏覽器中導入 Gemini Nano

Prompt API:為開發者在 Chrome 瀏覽器中導入 Gemini Nano

Hacker News·

Google 推出了 Prompt API,讓開發者能直接在 Chrome 瀏覽器中向內建的 Gemini Nano 模型發送自然語言請求。此 API 支援多模態輸入與結構化輸出,能在不依賴外部伺服器的情況下,實現高效的裝置端 AI 體驗。

背景

Google Chrome 團隊近期發布了 Prompt API 的技術文件,這是一項讓開發者能直接在瀏覽器中調用本地端大型語言模型 Gemini Nano 的新功能。透過此 API,網頁應用程式無需依賴雲端伺服器,即可執行翻譯、摘要、寫作建議或多模態輸入處理等任務,旨在提升隱私保護並降低開發者的運算成本。

社群觀點

Hacker News 社群對此 API 的討論呈現兩極化反應。支持者認為,這項技術最大的價值在於「隱私」與「零成本」。開發者 avaer 指出,這可以被視為「窮人版的 Ollama」,讓非技術用戶無需安裝複雜的本地環境,就能在瀏覽器中享受本地推論的好處,這對於低負載的 LLM 任務如搜尋或簡單處理非常理想。此外,這也解決了網頁應用程式必須要求用戶訂閱 ChatGPT 等第三方服務的門檻,將運算權力重新交回用戶手中。

然而,硬體門檻與資源消耗是社群最主要的疑慮。許多用戶對「至少需要 22 GB 剩餘磁碟空間」的要求感到震驚,認為這對行動裝置或入門級筆電來說是沉重的負擔。批評者指出,Gemini Nano 的模型體積遠大於瀏覽器本身,且首次使用的下載過程會造成極差的使用體驗。更有留言者擔心,這種 API 可能被惡意腳本濫用,將運算壓力轉嫁給不知情的訪客,甚至成為另一種形式的資源竊取。

在技術實用性方面,部分專業用戶對 Gemini Nano 的能力表示懷疑。有觀點認為該模型在處理超過兩輪的對話時表現不佳,若要執行更複雜的任務,目前仍需依賴如 Transformers.js 搭配更強大的模型(如 Qwen 0.9B)。儘管如此,社群中也出現了極具創意的應用構想,例如有人提議開發「去挑釁化」的瀏覽器擴充功能,利用此 API 在顯示社交媒體評論前,自動過濾掉攻擊性言詞或酸言酸語,將其轉化為中性或荒謬的語氣,藉此改善網路討論環境。

最後,社群對此 API 的未來定位有著深刻的討論。部分用戶期待這能推動作業系統層級的模型標準化,讓瀏覽器能直接調用系統內建的模型資源,而非每個應用程式都重複下載。雖然目前仍處於實驗階段且僅限桌面版 Chrome,但這被視為邁向「通用模型 API」的重要一步,未來若能整合 WebGPU 並推廣至行動端,將可能徹底改變網頁應用的開發範式。

延伸閱讀

  • Transformers.js:社群推薦用於瀏覽器端執行更強大開源模型的替代方案。
  • Mozilla Standards Positions:關於此 API 在瀏覽器標準化過程中的討論紀錄。
  • Apple Foundation Models:蘋果公司提供的類似底層模型 API,可作為跨平台發展的對照參考。

Hacker News

相關文章

  1. Gemini 3.1 Pro 模型說明文檔

    2 個月前

  2. Show HN:Chrome 新裝置端 AI API 的互動式遊樂場

    9 個月前

  3. Chrome 整合 Gemini 並加入自主任務的代理功能,挑戰 AI 瀏覽器

    Techcrunch · 3 個月前

  4. Gemini 3.1 Pro 預覽版

    2 個月前

  5. Show HN:Gemma Gem – 嵌入瀏覽器的 AI 模型 – 無需 API 金鑰,無需雲端

    21 天前

其他收藏 · 0