Prompt API：為開發者在 Chrome 瀏覽器中導入 Gemini Nano

Hacker News·大約 7 小時前

Google 推出了 Prompt API，讓開發者能直接在 Chrome 瀏覽器中向內建的 Gemini Nano 模型發送自然語言請求。此 API 支援多模態輸入與結構化輸出，能在不依賴外部伺服器的情況下，實現高效的裝置端 AI 體驗。

prompt api

背景

Google Chrome 團隊近期發布了 Prompt API 的技術文件，這是一項讓開發者能直接在瀏覽器中調用本地端大型語言模型 Gemini Nano 的新功能。透過此 API，網頁應用程式無需依賴雲端伺服器，即可執行翻譯、摘要、寫作建議或多模態輸入處理等任務，旨在提升隱私保護並降低開發者的運算成本。

社群觀點

Hacker News 社群對此 API 的討論呈現兩極化反應。支持者認為，這項技術最大的價值在於「隱私」與「零成本」。開發者 avaer 指出，這可以被視為「窮人版的 Ollama」，讓非技術用戶無需安裝複雜的本地環境，就能在瀏覽器中享受本地推論的好處，這對於低負載的 LLM 任務如搜尋或簡單處理非常理想。此外，這也解決了網頁應用程式必須要求用戶訂閱 ChatGPT 等第三方服務的門檻，將運算權力重新交回用戶手中。

然而，硬體門檻與資源消耗是社群最主要的疑慮。許多用戶對「至少需要 22 GB 剩餘磁碟空間」的要求感到震驚，認為這對行動裝置或入門級筆電來說是沉重的負擔。批評者指出，Gemini Nano 的模型體積遠大於瀏覽器本身，且首次使用的下載過程會造成極差的使用體驗。更有留言者擔心，這種 API 可能被惡意腳本濫用，將運算壓力轉嫁給不知情的訪客，甚至成為另一種形式的資源竊取。

在技術實用性方面，部分專業用戶對 Gemini Nano 的能力表示懷疑。有觀點認為該模型在處理超過兩輪的對話時表現不佳，若要執行更複雜的任務，目前仍需依賴如 Transformers.js 搭配更強大的模型（如 Qwen 0.9B）。儘管如此，社群中也出現了極具創意的應用構想，例如有人提議開發「去挑釁化」的瀏覽器擴充功能，利用此 API 在顯示社交媒體評論前，自動過濾掉攻擊性言詞或酸言酸語，將其轉化為中性或荒謬的語氣，藉此改善網路討論環境。

最後，社群對此 API 的未來定位有著深刻的討論。部分用戶期待這能推動作業系統層級的模型標準化，讓瀏覽器能直接調用系統內建的模型資源，而非每個應用程式都重複下載。雖然目前仍處於實驗階段且僅限桌面版 Chrome，但這被視為邁向「通用模型 API」的重要一步，未來若能整合 WebGPU 並推廣至行動端，將可能徹底改變網頁應用的開發範式。

你的個人知識庫

Prompt API：為開發者在 Chrome 瀏覽器中導入 Gemini Nano

背景

社群觀點

延伸閱讀