
Google 悄悄推出一款支援離線運作的 AI 語音轉文字應用程式
Google 推出了一款名為 Google AI Edge Eloquent 的離線優先語音轉文字應用程式,利用 Gemma AI 模型進行聽寫,並能自動過濾贅字以生成專業文本。
更新(太平洋時間 4 月 7 日晚上 10:30):該公司已更新應用程式商店列表,並刪除了提及 Android 版的內容。但同時也補充提到 iOS 鍵盤即將推出。
Google 週一在 iOS 上悄悄發布了一款名為「Google AI Edge Eloquent」的離線優先聽寫應用程式,旨在與 Wispr Flow、SuperWhisper、Willow 等同類產品競爭。
該應用程式可免費下載,一旦下載完基於 Gemma 的自動語音辨識(ASR)模型,您就可以開始在手機上進行聽寫。在應用程式中,您可以看到即時逐字稿,當您按下暫停時,應用程式會自動過濾掉如「嗯」、「啊」之類的贅詞,並對文本進行修飾。
逐字稿下方設有「重點」、「正式」、「簡短」和「長篇」等選項,用於轉換文本格式。

您也可以關閉雲端模式以使用純本地處理。(當雲端模式開啟時,應用程式會使用雲端 Gemini 模型進行文本清理。)如果需要,Google AI Edge Eloquent 可以從您的 Gmail 帳戶匯入特定的關鍵字、名稱和專業術語。此外,您還可以將自定義詞彙添加到列表中。
該應用程式會顯示聽寫紀錄,並允許您搜尋所有內容。它可以顯示上次聽寫的單詞、每分鐘字數速度以及說出的總字數。
「Google AI Edge Eloquent 是一款先進的聽寫應用程式,旨在彌合自然語言與專業、即用型文本之間的差距。與逐字記錄猶豫和贅詞的標準聽寫軟體不同,Eloquent 利用 AI 來捕捉您的原意。它會自動刪除『嗯』、『啊』以及句中的自我修正,輸出乾淨、準確的散文,」該公司的 App Store 描述中寫道。

雖然該應用程式目前僅在 iOS 上提供,但 App Store 的描述中提到了 Android 版本。(我們已聯繫 Google 尋求更多資訊,若收到回覆將更新報導。)
根據描述,Eloquent 提供「無縫的 Android 整合」,可將其設置為使用者的預設鍵盤,以便在任何文本欄位進行系統級訪問。此外,該應用程式將能使用懸浮按鈕功能(類似於 Wispr Flow 在 Android 上使用的功能),以便從任何地方輕鬆啟動聽寫。
隨著語音轉文字模型的進步,AI 驅動的逐字稿應用程式正受到使用者的歡迎。透過這款實驗性應用程式,Google 也加入了這一趨勢。如果這次測試成功,我們可能會看到 Android 平台上的聽寫功能也得到提升。