
Gemini 3.1 Flash Live:讓語音 AI 更加自然且可靠
我們最新的語音模型提升了精準度並降低延遲,使語音互動更加流暢、自然且精確,為開發者、企業及一般用戶提供新一代語音優先的 AI 體驗。
Gemini 3.1 Flash Live:讓音訊 AI 更加自然且可靠
2026 年 3 月 26 日
我們最新的語音模型提升了精準度並降低了延遲,使語音互動更加流暢、自然且精確。
內容摘要
Gemini 3.1 Flash Live 是 Google 品質最高的音訊模型,專為自然且可靠的即時對話而設計。開發者可以透過 Google AI Studio 中的 Gemini Live API 存取,企業則可將其用於客戶體驗。每個人都可以透過 Search Live 和 Gemini Live 體驗它,目前已支援超過 200 個國家。
重點列表
探索其他風格:
今天,我們正透過 Gemini 3.1 Flash Live 推進 Gemini 的即時對話能力,這是我們迄今為止品質最高的音訊與語音模型。它提供了下一代語音優先 AI 所需的速度與自然節奏,為開發者、企業和日常用戶提供更直覺的體驗。
3.1 Flash Live 已在 Google 各項產品中推出:
給開發者:強大的推理與任務執行能力
我們提升了 3.1 Flash Live 的整體品質,使其對於開發者和企業在構建能大規模完成複雜任務的語音優先代理(Agents)時更加可靠。在 ComplexFuncBench Audio(一項評測包含各種限制的多步驟函式呼叫基準測試)中,它以 90.8% 的得分領先於我們之前的模型。


在 Scale AI 的 Audio MultiChallenge 中,Gemini 3.1 Flash Live 在開啟「思考(thinking)」模式下以 36.1% 的得分領先。該基準測試專門測試在現實世界音訊中常見的中斷和猶豫情況下,模型對複雜指令的遵循和長程推理能力。

3.1 Flash Live 還提升了對語氣的理解,以提供更自然的對話。在用於客戶體驗的 Gemini Enterprise 中,它在識別音調和速度等聲學細微差別方面比 2.5 Flash Native Audio 更有效。它還能更好地根據用戶表達的沮喪或困惑動態調整其回應。
3.1 Flash Live 讓您能夠構建可在嘈雜環境中處理複雜任務的語音代理。
由 Gemini 3.1 Pro 構建、Gemini 3.1 Flash Live 驅動的說明性演示。
3.1 Flash Live 讓您能使用語音進行 Vibe Coding 並快速迭代。
由 Gemini 3.1 Pro 構建、Gemini 3.1 Flash Live 驅動的說明性演示。
Verizon、LiveKit 和 The Home Depot 等公司對 3.1 Flash Live 在其工作流程中的表現給予了正面回饋,強調了其改進後的自然對話能力。






給每個人:更自然且直覺的互動
在 Gemini Live 和 Search Live 中,3.1 Flash Live 模型提供了更有幫助且自然的回應,無論您是詢問日常簡短問題,還是進行更複雜的對話。
憑藉 3.1 Flash Live 模型的底層支持,Gemini Live 的回應速度比之前的模型更快,且追蹤對話思路的時間延長了兩倍,讓您在較長時間的腦力激盪中保持思緒連貫。
3.1 Flash Live 讓 Gemini Live 更快且更有幫助
3.1 Flash Live 本身也具備多語言能力,這促成了本週 Search Live 的全球擴展。隨著此次發布,超過 200 個國家和地區的使用者現在可以使用其偏好的語言與 Search 進行即時、多模態的對話。
在 Search Live 中使用 3.1 Flash Live 獲取即時故障排除協助
嘗試 Gemini 3.1 Flash Live
所有由 3.1 Flash Live 生成的音訊都帶有 SynthID 水印。這種肉耳無法察覺的水印直接織入音訊輸出中,以便可靠地檢測 AI 生成的內容,幫助防止虛假訊息。有關我們安全與責任方法的更多資訊,請參閱模型卡(model card)。
從今天開始,體驗 3.1 Flash Live 的自然性與可靠性。我們期待看到您如何與它互動並進行開發。
在您的收件匣中獲取更多來自 Google 的故事。
在您的收件匣中獲取更多來自 Google 的故事。
您的資訊將根據 Google 的隱私權政策使用。
完成。只需再一個步驟。
請檢查您的收件匣以確認訂閱。
您已經訂閱了我們的電子報。
您也可以使用不同的電子郵件地址訂閱。