
Parloa 利用 OpenAI 模型驅動可擴展的語音 AI 客戶服務代理,使企業能夠設計、模擬並部署可靠的即時互動。
2026 年 5 月 7 日
Parloa 使用 OpenAI 模型為企業模擬、評估並運行語音驅動的客戶服務系統。

在 Parloa 創立初期,聯合創始人 Stefan Ostwald 曾在一家保險公司的呼叫中心待了一整天,當時他的團隊正在那裡開發早期的語音體驗。他坐在客服專員身邊,聽著同樣的對話一次又一次地重複上演:重設密碼、保單諮詢、例行變更。他意識到,這些工作中的大部分都可以實現自動化。
在那次經歷之後,總部位於柏林的 Parloa 開始開發基於規則的語音代理,以自動化處理大量的客戶互動。
隨著 ChatGPT 的出現,該公司進一步發展,開發了現在的 AI 代理管理平台 (AMP),該平台建立在包括 GPT-5.4 在內的新一代模型之上。
AMP 為企業提供了一種大規模設計、部署和管理客戶服務互動的方法。團隊不再需要規劃僵化的意圖和流程,而是可以用自然語言定義行為、連接內部系統,並利用內建的模擬和評估功能快速迭代。
Parloa 端到端地運行這些互動,處理從簡單的路由到複雜的多步驟請求。其重點在於生產環境中的一致性,效能、延遲和邊緣案例在其中都至關重要。為了達到這一目標,Parloa 在部署模型之前,會根據真實的客戶場景對其進行持續測試。
Parloa 的代理管理平台 (AMP) 專為業務使用者和領域專家設計,使他們無需編寫程式碼即可構建 AI 代理。
「透過 AMP,我們可以讓來自不同業務部門的領域專家以更精簡、更簡單的方式實際構建代理並連接 API,」O’Reilly 表示。
從高層次來看,AMP 允許品牌管理整個 AI 代理的生命週期。它為非技術團隊提供了一種更簡單的方法,在代理上線之前定義其行為方式。領域專家無需編寫程式碼或繪製僵化的意圖樹,而是使用自然語言設定代理的角色、指令、工具和邊界。該配置成為模型提示詞的基礎,以及系統在生產環境中行為的依據。
一旦定義完成,代理在部署前會經過測試。Parloa 使用 GPT-5.4 等模型模擬客戶對話,其中一個模型扮演撥打電話者,另一個模型運行配置好的代理。團隊可以直接檢查這些互動,針對現實場景測試變更,並在正式上線前進行迭代。
接著,同樣的模型會結合確定性檢查和「LLM 作為評審 (LLM-as-a-judge)」評分來評估這些對話。這能顯示代理是否遵循了指令、是否正確使用了工具,以及是否按預期完成了任務。




在即時對話期間,AMP 的編排層會將代理配置和對話上下文提示給 OpenAI 模型,以生成回覆、透過 RAG 檢索資訊,或觸發工具與客戶後端進行互動。Parloa 會隨著新一代模型的推出持續更新此層級,只要這些模型在現實世界的效能中展現出明顯的提升。
對話結束後,獨立的 OpenAI 驅動工作流會總結互動、分類客戶意圖,並根據定義的規則評估表現。
隨著代理變得越來越複雜,維護單一且龐大的提示詞變得更加困難。微小的變更可能會引入意想不到的副作用。為了應對這一挑戰,Parloa 引入了模組化方法。身分驗證、預訂變更或帳戶更新等任務可以拆分為獨立的子代理,從而提高指令遵循能力,並使系統更容易隨時間演進。
同時,該平台在可靠性最重要的地方納入了確定性控制。企業可以定義結構化的 API 鏈和基於事件的邏輯,以確保關鍵步驟按正確順序發生,在對話靈活性與可預測的執行之間取得平衡。
Parloa 使用 GPT-4.1、GPT-5-mini 等模型在代理上線前模擬真實的客戶互動,然後結合 LLM 作為評審和確定性規則來評估這些互動。這讓團隊能夠測試邊緣案例、快速迭代,並在讓客戶接觸到可能的失敗之前驗證效能。
Parloa 主要與大型企業合作,對這些企業而言,一致性與能力同樣重要。
「當新模型發佈時,我們會對其運行基準測試套件,」高級應用科學家 Matthäus Deutsch 表示。「對我們來說,重要的是這些功能不僅在理論基準測試中有效,而且在實際的真實使用案例中也有效。」
Parloa 不依賴抽象的基準測試,而是鏡像真實的生產代理,並讓它們通過模擬和評估流水線。這些測試衡量指令遵循的可靠性、API 調用的一致性、延遲以及在現實條件下的整體效能。
這些評估決定了哪些模型可以投入生產。只有在真實客戶場景中表現可靠的模型才會被部署。
「企業客戶面臨著真實的遷移成本,」Deutsch 說。「一旦系統在生產環境中運行,他們會保持其穩定,只有在效益明確時才會切換。」
因此,系統在生產環境中的行為是可預測的,即使在大規模運行時也是如此。在數百萬次的客戶互動中,大多數對話都能順暢解決。即使通話被轉接到人工代理,升級處理也很少是因為系統故障引起的。在一次部署中,一家全球旅遊公司將人工代理的請求減少了 80%。
這種評估優先的思維已成為核心競爭優勢,使 Parloa 能夠在不犧牲生產環境可靠性的情況下快速行動。
語音引入了與文字聊天不同的一系列約束。每一次互動都經過一個低延遲的流水線:語音轉文字、模型推理以及文字轉語音。
這個流水線使得延遲變得至關重要。即使是模型層的微小延遲,也會累積成撥打電話者能明顯察覺的停頓,這影響了模型的選擇和優化方式。
Parloa 與 OpenAI 密切合作,針對即時使用案例優化效能,重點關注延遲、回覆品質和指令遵循。團隊在將新模型迭代推廣到即時客戶互動之前,會在類生產環境中持續進行評估和壓力測試。
Parloa 獨立評估語音技術棧的每個組件:
從一開始,這些系統就是為全球部署而構建的。基準測試涵蓋多種語言,客戶遍布全球各個地區。這種多語言的嚴謹性既反映了 Parloa 的歐洲根源,也符合企業客戶的期望——他們要求在各個市場(而不僅僅是單一語言或地區)都有一致的表現。
如今,Parloa 的代理處理著零售、旅遊和保險等行業的數百萬次對話,支援的使用案例從支援自動化到電視購物等創收流程。
Parloa 預見客戶服務將演變為完全的多模態體驗。
一段對話可能從電話開始,在聊天中繼續,並在過程中包含連結或互動元素。AMP 的設計並非將每一步視為獨立的流程,而是將其作為單一互動來處理。隨著時間推移,AI 代理可能會像網站和行動應用程式一樣,成為客戶旅程的核心。
隨著企業轉向自動化處理日益增長的客戶互動,Parloa 致力於讓 AI 代理足夠可靠、足夠靈活且足夠值得信賴,以便在全球規模下運行。

新創公司 2026 年 4 月 1 日

新創公司 2026 年 3 月 6 日

新創公司 2026 年 1 月 22 日
— OpenAI
相關文章
其他收藏 · 0