Parloa 打造客戶真正想與之交談的服務代理

OpenAI·1 天前

Parloa 利用 OpenAI 模型驅動可擴展的語音 AI 客戶服務代理，使企業能夠設計、模擬並部署可靠的即時互動。

2026 年 5 月 7 日

Parloa 打造客戶樂於與之交談的服務代理

Parloa 使用 OpenAI 模型為企業模擬、評估並運行語音驅動的客戶服務系統。

Parloa

在 Parloa 創立初期，聯合創始人 Stefan Ostwald 曾在一家保險公司的呼叫中心待了一整天，當時他的團隊正在那裡開發早期的語音體驗。他坐在客服專員身邊，聽著同樣的對話一次又一次地重複上演：重設密碼、保單諮詢、例行變更。他意識到，這些工作中的大部分都可以實現自動化。

在那次經歷之後，總部位於柏林的 Parloa 開始開發基於規則的語音代理，以自動化處理大量的客戶互動。

隨著 ChatGPT 的出現，該公司進一步發展，開發了現在的 AI 代理管理平台 (AMP)，該平台建立在包括 GPT-5.4 在內的新一代模型之上。

AMP 為企業提供了一種大規模設計、部署和管理客戶服務互動的方法。團隊不再需要規劃僵化的意圖和流程，而是可以用自然語言定義行為、連接內部系統，並利用內建的模擬和評估功能快速迭代。

Parloa 端到端地運行這些互動，處理從簡單的路由到複雜的多步驟請求。其重點在於生產環境中的一致性，效能、延遲和邊緣案例在其中都至關重要。為了達到這一目標，Parloa 在部署模型之前，會根據真實的客戶場景對其進行持續測試。

為企業開發者設計 AMP

Parloa 的代理管理平台 (AMP) 專為業務使用者和領域專家設計，使他們無需編寫程式碼即可構建 AI 代理。

「透過 AMP，我們可以讓來自不同業務部門的領域專家以更精簡、更簡單的方式實際構建代理並連接 API，」O’Reilly 表示。

從高層次來看，AMP 允許品牌管理整個 AI 代理的生命週期。它為非技術團隊提供了一種更簡單的方法，在代理上線之前定義其行為方式。領域專家無需編寫程式碼或繪製僵化的意圖樹，而是使用自然語言設定代理的角色、指令、工具和邊界。該配置成為模型提示詞的基礎，以及系統在生產環境中行為的依據。

一旦定義完成，代理在部署前會經過測試。Parloa 使用 GPT-5.4 等模型模擬客戶對話，其中一個模型扮演撥打電話者，另一個模型運行配置好的代理。團隊可以直接檢查這些互動，針對現實場景測試變更，並在正式上線前進行迭代。

接著，同樣的模型會結合確定性檢查和「LLM 作為評審 (LLM-as-a-judge)」評分來評估這些對話。這能顯示代理是否遵循了指令、是否正確使用了工具，以及是否按預期完成了任務。

Parloa 視覺效果

Parloa 介面顯示助手正在根據上傳的文件調整新代理。

用於創建 AI 評審評估規則的 Parloa 介面。

Parloa 介面顯示用於測試 AI 代理的模擬客戶對話。

在即時對話期間，AMP 的編排層會將代理配置和對話上下文提示給 OpenAI 模型，以生成回覆、透過 RAG 檢索資訊，或觸發工具與客戶後端進行互動。Parloa 會隨著新一代模型的推出持續更新此層級，只要這些模型在現實世界的效能中展現出明顯的提升。

對話結束後，獨立的 OpenAI 驅動工作流會總結互動、分類客戶意圖，並根據定義的規則評估表現。

隨著代理變得越來越複雜，維護單一且龐大的提示詞變得更加困難。微小的變更可能會引入意想不到的副作用。為了應對這一挑戰，Parloa 引入了模組化方法。身分驗證、預訂變更或帳戶更新等任務可以拆分為獨立的子代理，從而提高指令遵循能力，並使系統更容易隨時間演進。

同時，該平台在可靠性最重要的地方納入了確定性控制。企業可以定義結構化的 API 鏈和基於事件的邏輯，以確保關鍵步驟按正確順序發生，在對話靈活性與可預測的執行之間取得平衡。

Parloa 使用 GPT-4.1、GPT-5-mini 等模型在代理上線前模擬真實的客戶互動，然後結合 LLM 作為評審和確定性規則來評估這些互動。這讓團隊能夠測試邊緣案例、快速迭代，並在讓客戶接觸到可能的失敗之前驗證效能。

評估優先的方法

Parloa 主要與大型企業合作，對這些企業而言，一致性與能力同樣重要。

「當新模型發佈時，我們會對其運行基準測試套件，」高級應用科學家 Matthäus Deutsch 表示。「對我們來說，重要的是這些功能不僅在理論基準測試中有效，而且在實際的真實使用案例中也有效。」

Parloa 不依賴抽象的基準測試，而是鏡像真實的生產代理，並讓它們通過模擬和評估流水線。這些測試衡量指令遵循的可靠性、API 調用的一致性、延遲以及在現實條件下的整體效能。

這些評估決定了哪些模型可以投入生產。只有在真實客戶場景中表現可靠的模型才會被部署。

「企業客戶面臨著真實的遷移成本，」Deutsch 說。「一旦系統在生產環境中運行，他們會保持其穩定，只有在效益明確時才會切換。」

因此，系統在生產環境中的行為是可預測的，即使在大規模運行時也是如此。在數百萬次的客戶互動中，大多數對話都能順暢解決。即使通話被轉接到人工代理，升級處理也很少是因為系統故障引起的。在一次部署中，一家全球旅遊公司將人工代理的請求減少了 80%。

這種評估優先的思維已成為核心競爭優勢，使 Parloa 能夠在不犧牲生產環境可靠性的情況下快速行動。

構建全球規模的語音服務

語音引入了與文字聊天不同的一系列約束。每一次互動都經過一個低延遲的流水線：語音轉文字、模型推理以及文字轉語音。

這個流水線使得延遲變得至關重要。即使是模型層的微小延遲，也會累積成撥打電話者能明顯察覺的停頓，這影響了模型的選擇和優化方式。

Parloa 與 OpenAI 密切合作，針對即時使用案例優化效能，重點關注延遲、回覆品質和指令遵循。團隊在將新模型迭代推廣到即時客戶互動之前，會在類生產環境中持續進行評估和壓力測試。

Parloa 獨立評估語音技術棧的每個組件：

從一開始，這些系統就是為全球部署而構建的。基準測試涵蓋多種語言，客戶遍布全球各個地區。這種多語言的嚴謹性既反映了 Parloa 的歐洲根源，也符合企業客戶的期望——他們要求在各個市場（而不僅僅是單一語言或地區）都有一致的表現。

如今，Parloa 的代理處理著零售、旅遊和保險等行業的數百萬次對話，支援的使用案例從支援自動化到電視購物等創收流程。

為不斷變化的客戶旅程改變技術

Parloa 預見客戶服務將演變為完全的多模態體驗。

一段對話可能從電話開始，在聊天中繼續，並在過程中包含連結或互動元素。AMP 的設計並非將每一步視為獨立的流程，而是將其作為單一互動來處理。隨著時間推移，AI 代理可能會像網站和行動應用程式一樣，成為客戶旅程的核心。

隨著企業轉向自動化處理日益增長的客戶互動，Parloa 致力於讓 AI 代理足夠可靠、足夠靈活且足夠值得信賴，以便在全球規模下運行。

OpenAI <3 新創公司

延伸閱讀

oai GradientLabs 1x1

新創公司 2026 年 4 月 1 日

Descript > 1x1 Card

新創公司 2026 年 3 月 6 日

oai Praktika 1x1

新創公司 2026 年 1 月 22 日

— OpenAI

其他收藏 · 0

Parloa 打造客戶真正想與之交談的服務代理

OpenAI·1 天前

Parloa 利用 OpenAI 模型驅動可擴展的語音 AI 客戶服務代理，使企業能夠設計、模擬並部署可靠的即時互動。

2026 年 5 月 7 日