
Uber 使用 OpenAI 來驅動 AI 助手和語音功能,幫助駕駛更聰明地賺錢,並讓乘客在全球即時市場中更快速地預約。
2026 年 5 月 6 日
Uber 利用 OpenAI 驅動 AI 助手和語音功能,協助司機在全天候即時運作的全球市場中更聰明地賺錢,並讓乘客能更快速地預訂行程。
成果
170 萬
全球同時進行的行程數量
每天有數百萬人依賴 Uber 預訂行程、訂購餐點、寄送包裹以及彈性賺取收入。每一次點擊的背後,都是一個受交通、天氣、機場抵達航班、當地活動和需求影響的複雜即時市場。Uber 的營運規模龐大:每天有 4,000 萬趟行程,在超過 70 個國家的 15,000 個城市中擁有 1,000 萬名司機和外送合作夥伴。每個城市都有其獨特的營運動態、法規和乘客行為,這創造了一個必須在全球規模下持續調整的系統。
Uber 長期以來一直使用機器學習來支援其市場運作。而現在,藉助大型語言模型和 OpenAI 的前沿模型,Uber 能夠更快速地分析複雜信號,提供即時的對話式回應,並在應用程式內驅動語音體驗。
Uber 與 OpenAI 的合作正協助 Uber 打造 AI 驅動的產品,簡化司機和外送合作夥伴的獲利機會,並減少乘客的阻礙。透過使用 OpenAI 的模型,Uber 能比以往更快速地推出精簡的產品和體驗。
對於司機來說,靈活性是 Uber 最大的優勢之一。有些人全職開車,有些人只在週末兼職,還有些人則是在課間或輪班空檔開車。這種靈活性也意味著司機需要不斷評估選擇並提出問題:我現在應該在哪裡排班?去機場值得嗎?午餐時段我應該從載客轉為外送嗎?為什麼我今天的收入看起來不一樣?
為了協助回答這些問題,Uber 開發了 Uber Assistant,這是一款 AI 驅動的助手,旨在協助司機在平台上的整個生命週期——從加入培訓、首次行程到日常收入優化。
「我們希望透過提供市場摘要視圖和即時洞察,讓司機能夠為自己做出更好的決定,」Uber 產品管理總監 Dharmin Parikh 表示。
該助手透過將收入趨勢和熱點圖等複雜數據轉化為簡單、具體的位置指引,協助司機了解在何處以及何時可以賺錢。司機隨後可以用自然語言提出後續問題,並獲得量身定制的回應,輕鬆操作應用程式。
Uber 的目標是減少「認知負荷」——即在嘗試賺錢的同時,解讀複雜市場數據所需的精力。
這對新司機來說尤其寶貴。Uber 發現,使用 AI 來總結並輕鬆傳達 Uber 的現實數據,可以協助司機比單靠摸索更快地學習工作流程和市場動態,從而加速上手過程。
雖然最初預期 Uber Assistant 對新司機的幫助最大,但資深司機也會反覆回來詢問後續問題並優化他們在平台上的時間——這證實了該產品是一項長期的工具,而不僅僅是入職工具。
「與需要跑幾百趟行程才能理解平台運作方式相比,這款助手正協助司機快速上手,」Parikh 說。
對於 Uber 而言,在實施任何會與司機和外送員互動的 AI 系統時,準確性、安全性、可靠性和速度是首要任務。關鍵考量包括回應必須符合政策,且延遲需達到用戶對即時行動應用程式所期望的標準。
這就是為什麼 Uber 圍繞三個核心原則設計 Uber Assistant:安全、信任和低延遲。
Uber 的工程團隊構建了一個多代理架構(multi-agent architecture),將每個用戶請求路由到最合適的專業系統。例如,收入問題的處理方式可以與入職問題不同,而市場指引所需的推理邏輯也與交易行為不同。
這種架構使 Uber 能夠將每項任務分配給最適合其特定營運需求的模型,確保每個查詢都能得到適當的關注。
對於輕量級分類和快速回應,Uber 使用更快速的 nano/mini 模型。對於更複雜的任務,Uber 則利用較大的推理模型。
Uber 還開發了 AI Guard,這是一個內部治理層,協助篩選提示(prompts)和回應,以促進安全、隱私和保障,執行政策,減少幻覺,並保持跨體驗的一致性。
當司機收到準確、有用的建議時,他們會再次使用。他們會提出更多問題,反覆參與,並在平台上花費更多具生產力的時間。
「如果用戶不信任這個系統,你很快就會失去他們,」Parikh 說。「但當他們看到價值時,他們就會回來。」
Uber 也正在將 OpenAI Realtime API 應用於科技界的下一個重大界面轉變:語音。
在應用程式中打字對於簡單的請求可能很有效。但許多交通和商業需求更為複雜。
一位旅客可能會說:「我有五件行李,還有另外五個人。我需要一趟舒適的車去機場。你有什麼建議?」年長者或視障乘客可能更喜歡說話,而不是在選單中點擊。
Uber 全新的語音體驗旨在讓這些時刻變得毫無阻礙。用戶可以點擊 Uber App 搜尋欄上的麥克風圖示,並使用自然語言請求行程。系統使用 Realtime API 和其他前沿模型來解讀意圖,利用儲存的地點和客戶背景提供建議,同時在應用程式內同步語音和視覺回應。
這可能意味著為行李較多的行程建議 UberXL,或識別如「家」之類的儲存目的地。
「語音消除了每次只能完成一項任務的障礙,」Parikh 說。「你可以自然地表達完整的意圖,系統則可以協調出結果。」
語音還擴展了無障礙性,並在 Uber 的生態系統中開啟了新的工作流程。在司機端,它讓司機能夠免持操作應用程式。在乘客端,它可以為追求更快速、更簡單互動的客戶減少摩擦。
「語音消除了多次點擊的障礙,因為你可以同時說多件事,」Vidyasagar 說。「它解鎖了連接生態系統各個部分的能力。」

隨著 LLM 能力的快速演進,Uber 也改變了團隊的構建方式。
整個組織的工程師都在處理提示詞、檢索系統、評估流水線和編排框架。產品、法律、營運和設計團隊更緊密地合作,以定義政策邊界、測試輸出並改善用戶體驗。
現在,智慧可以嵌入到整個公司,而不僅僅是由一個小型的集中式 AI 團隊負責創新。
「這不再是一個專門的小組在做所有事情,」Vidyasagar 說。「許多團隊都可以貢獻力量,因為構建的門檻已經降低了。」
這種轉變加速了實驗,並在 Uber 的生態系統中激發了新想法。
「每一次駕駛、每一趟行程都是一連串的事件,而理解並處理這些細微差別正是 LLM 為我們解鎖的能力,」Vidyasagar 說。「這為我們提供了大量關於下一步該往哪走的資訊,而這種解鎖——在我們擁有的規模下——是非常強大的。」
Uber Assistant 目前已在美國司機網路中進行實驗性推廣,同時 Uber 繼續測試並優化體驗:
從協助新司機完成第一趟行程,到引導尋求更好獲利機會的資深司機,Uber 正在使用 OpenAI 模型讓工作更具生產力、交通更無縫,並讓日常物流更具人性化。
「作為一名工程師,OpenAI 解鎖了以不同且獨特的方式解決這些問題的能力,」Vidyasagar 說。

公司 | 2026 年 5 月 6 日

公司 | 2026 年 5 月 6 日

產品 | 2026 年 5 月 5 日
— OpenAI
相關文章
其他收藏 · 0