
以文本翻譯聞名的 DeepL 現在想翻譯您的聲音
DeepL 推出了一套語音對語音翻譯工具,可用於 Zoom 和 Microsoft Teams 等會議工具的即時翻譯,我們認為這是在深耕文本翻譯多年後的自然演進。
DeepL 是一家以文本工具聞名的翻譯公司,今日發布了一套語音對語音翻譯套件,涵蓋了會議、行動與網頁對話,以及透過自定義應用程式為第一線工作人員提供的群組對話等使用場景。該公司還發布了一個 API,讓外部開發者和企業能夠基於 DeepL 的技術構建自定義用途,例如呼叫中心。
「在深耕文本翻譯多年後,語音對我們來說是自然而然的一步,」DeepL 執行長 Jarek Kutylowski 在接受 TechCrunch 採訪時表示。「我們在文本翻譯和文件翻譯方面已經取得了長足的進步。但我們認為目前還沒有一款出色的實時語音翻譯產品。」
Kutylowski 表示,開發實時翻譯產品的挑戰在於如何在降低延遲(即說話者發言與翻譯音訊播放之間的延遲)與保持準確結果之間取得平衡。
DeepL 正在為 Zoom 和 Microsoft Teams 等平台發布外掛程式,聽眾可以在他人使用母語說話時聽到實時翻譯,或是在螢幕上查看實時翻譯的文字。該計畫目前處於早期測試階段,公司正邀請各組織加入候補名單。該公司還擁有一款適用於行動裝置和網頁對話的產品,可用於面對面或遠端交流。
DeepL 還允許用戶參與培訓課程或工作坊等場景下的群組對話,參與者可以透過 QR code 加入。
DeepL 表示,其語音對語音技術還可以學習並適應自定義詞彙,例如行業特定術語、公司名稱和個人姓名。
Kutylowski 表示,人工智慧正在重塑未來幾年客戶服務的面貌。他指出,翻譯層能幫助企業在合格員工稀缺且招聘成本高昂的語言環境中提供支援。
在 Disrupt 會見您的下一位投資者或新創組合
您的下一輪融資、下一位員工、下一個突破機會。盡在 TechCrunch Disrupt 2026。屆時將有超過 10,000 名創辦人、投資者和科技領袖齊聚一堂,參加為期三天、超過 250 場的實戰會議、強大的引薦以及定義市場的創新。立即註冊,最高可節省 410 美元。
在 Disrupt 會見您的下一位投資者或新創組合
您的下一輪融資、下一位員工、下一個突破機會。盡在 TechCrunch Disrupt 2026。屆時將有超過 10,000 名創辦人、投資者和科技領袖齊聚一堂,參加為期三天、超過 250 場的實戰會議、強大的引薦以及定義市場的創新。立即註冊,最高可節省 410 美元。
該公司表示,它掌控著整個語音對語音的技術棧。然而,目前的系統是將語音轉換為文本,進行翻譯,然後再將其轉換回語音。DeepL 認為,由於其多年來一直致力於文本翻譯,因此在翻譯品質上具有優勢。展望未來,該公司希望開發一種端到端的語音翻譯模型,完全跳過文本步驟。
DeepL 面臨著來自幾家資金充足、在相關領域深耕的新創公司的競爭。Sanas 去年從 Quadrille Capital 和 Teleperformance 籌集了 6,500 萬美元,利用 AI 實時修改說話者的口音——這是一款主要針對呼叫中心代理的工具。
總部位於杜拜的 Camb.AI 專注於為媒體和娛樂公司(如 Amazon Web Services)提供語音合成和翻譯,幫助他們大規模地為影片內容進行配音和在地化。
由 Reddit 共同創辦人 Alexis Ohanian 的公司 Seven Seven Six 支持的 Palabra,正在構建一個實時語音翻譯引擎,旨在保留語義和說話者的原始聲音,這使其與 DeepL 目前正在構建的產品產生了更直接的競爭。