
Prompt API:為開發者在 Chrome 瀏覽器中導入 Gemini Nano
Google 推出了 Prompt API,讓開發者能直接在 Chrome 瀏覽器中向內建的 Gemini Nano 模型發送自然語言請求。此 API 支援多模態輸入與結構化輸出,能在不依賴外部伺服器的情況下,實現高效的裝置端 AI 體驗。
背景
Google Chrome 團隊近期發布了 Prompt API 的技術文件,這是一項讓開發者能直接在瀏覽器中調用本地端大型語言模型 Gemini Nano 的新功能。透過此 API,網頁應用程式無需依賴雲端伺服器,即可執行翻譯、摘要、寫作建議或多模態輸入處理等任務,旨在提升隱私保護並降低開發者的運算成本。
社群觀點
Hacker News 社群對此 API 的討論呈現兩極化反應。支持者認為,這項技術最大的價值在於「隱私」與「零成本」。開發者 avaer 指出,這可以被視為「窮人版的 Ollama」,讓非技術用戶無需安裝複雜的本地環境,就能在瀏覽器中享受本地推論的好處,這對於低負載的 LLM 任務如搜尋或簡單處理非常理想。此外,這也解決了網頁應用程式必須要求用戶訂閱 ChatGPT 等第三方服務的門檻,將運算權力重新交回用戶手中。
然而,硬體門檻與資源消耗是社群最主要的疑慮。許多用戶對「至少需要 22 GB 剩餘磁碟空間」的要求感到震驚,認為這對行動裝置或入門級筆電來說是沉重的負擔。批評者指出,Gemini Nano 的模型體積遠大於瀏覽器本身,且首次使用的下載過程會造成極差的使用體驗。更有留言者擔心,這種 API 可能被惡意腳本濫用,將運算壓力轉嫁給不知情的訪客,甚至成為另一種形式的資源竊取。
在技術實用性方面,部分專業用戶對 Gemini Nano 的能力表示懷疑。有觀點認為該模型在處理超過兩輪的對話時表現不佳,若要執行更複雜的任務,目前仍需依賴如 Transformers.js 搭配更強大的模型(如 Qwen 0.9B)。儘管如此,社群中也出現了極具創意的應用構想,例如有人提議開發「去挑釁化」的瀏覽器擴充功能,利用此 API 在顯示社交媒體評論前,自動過濾掉攻擊性言詞或酸言酸語,將其轉化為中性或荒謬的語氣,藉此改善網路討論環境。
最後,社群對此 API 的未來定位有著深刻的討論。部分用戶期待這能推動作業系統層級的模型標準化,讓瀏覽器能直接調用系統內建的模型資源,而非每個應用程式都重複下載。雖然目前仍處於實驗階段且僅限桌面版 Chrome,但這被視為邁向「通用模型 API」的重要一步,未來若能整合 WebGPU 並推廣至行動端,將可能徹底改變網頁應用的開發範式。
延伸閱讀
- Transformers.js:社群推薦用於瀏覽器端執行更強大開源模型的替代方案。
- Mozilla Standards Positions:關於此 API 在瀏覽器標準化過程中的討論紀錄。
- Apple Foundation Models:蘋果公司提供的類似底層模型 API,可作為跨平台發展的對照參考。
相關文章
其他收藏 · 0