OpenAI 全新 GPT-5.5 驅動 NVIDIA 基礎設施上的 Codex — NVIDIA 已將其投入實際應用

OpenAI 全新 GPT-5.5 驅動 NVIDIA 基礎設施上的 Codex — NVIDIA 已將其投入實際應用

Nvidia Blog·

AI 代理已徹底改變開發者工作流程,其下一個前沿是知識工作。OpenAI 的代理編碼應用程式 Codex 現由最新的 GPT-5.5 模型驅動,並運行於 NVIDIA GB200 NVL72 機架級系統,正協助萬名 NVIDIA 員工實現突破性的成果。

AI 代理(AI agents)已經徹底改變了開發者的工作流程,而它們的下一個前沿領域是知識工作:處理資訊、解決複雜問題、提出新想法並推動創新。

OpenAI 的代理式編碼應用程式 Codex 正在開啟這一新前沿。它現在由 OpenAI 最新的前沿模型 GPT-5.5 提供動力,該模型運行在 NVIDIA GB200 NVL72 機架級系統上。

超過 10,000 名 NVIDIA 員工——涵蓋工程、產品、法律、行銷、財務、銷售、人力資源、營運和開發者計畫——已經在使用由 GPT-5.5 驅動的 Codex,並取得了用他們的話來說是「令人驚嘆」且「改變生活」的成果。

NVIDIA 工程師已經透過 Codex 應用程式使用 GPT-5.5 數週,其收益是可衡量的。該模型運行在 GB200 NVL72 上,與前代系統相比,它能夠將每百萬個 token 的成本降低 35 倍,且每兆瓦每秒的 token 輸出量提高 50 倍——這種經濟效益使得前沿模型推理在企業規模上變得切實可行。

曾經長達數天的除錯週期現在縮短至數小時。先前需要數週的實驗,在複雜的多文件程式碼庫中正轉化為隔夜即可見的進展。團隊正根據自然語言指令交付端到端的功能,其可靠性更高,且浪費的週期比早期模型更少。

OpenAI 令人驚嘆的進展,只是 NVIDIA 與每家前沿模型公司合作的最新範例——這不僅是為了加速 NVIDIA 內部 AI 代理的使用,也是為了幫助公司的合作夥伴為每個人構建世界上最好、成本最低且能源效率最高的模型。

正如 NVIDIA 創辦人暨執行長黃仁勳在給員工的全員電子郵件中敦促大家使用 Codex 時所說:「讓我們跳躍到光速。歡迎來到 AI 時代。」

為企業安全而構建的部署

就像人類一樣,每個代理都需要自己專用的電腦。

為了確保在安全的企業環境中無縫運行,Codex 應用程式支援遠端安全外殼(SSH)連接到經核准的雲端虛擬機,允許代理在不向外部暴露數據的情況下處理真實的公司數據。

因此,為了確保最大的安全性和可審計性,NVIDIA IT 部門為每位員工部署了雲端虛擬機(VM),以便安全地運行他們的代理。這為代理提供了一個專用沙盒,使其在保持完整可審計性的同時,能發揮最大能力。用戶可以透過每個員工都熟悉的用戶界面,控制在雲端虛擬機中運行的 Codex 代理。

NVIDIA 的部署遵循零數據保留政策,代理透過命令行界面和 Skills(NVIDIA 用於在全公司運行自動化工作流的同一套代理工具包)以唯讀權限訪問生產系統。

十年的全棧合作

GPT-5.5 的發布和 Codex 的推廣反映了 NVIDIA 與 OpenAI 之間超過 10 年的合作。這段夥伴關係始於 2016 年,當時 NVIDIA 創辦人暨執行長黃仁勳親手將第一台 NVIDIA DGX-1 AI 超級電腦交付給 OpenAI 位於舊金山的總部。

從那時起,兩家公司在整個 AI 堆疊領域展開了密切合作。

NVIDIA 是 OpenAI gpt-oss 開放權重模型發布的「零日」合作夥伴,為 NVIDIA TensorRT-LLM 以及包括 vLLM 和 Ollama 在內的生態系統框架優化了模型權重。

OpenAI 已承諾為其下一代 AI 基礎設施部署超過 10 吉瓦(GW)的 NVIDIA 系統——這一建設規模將使數百萬顆 NVIDIA GPU 成為 OpenAI 未來多年模型訓練和推理的基石。

此外,OpenAI 和 NVIDIA 是早期的晶片與共同設計合作夥伴:OpenAI 提供反饋以影響 NVIDIA 的硬體路線圖,並反過來獲得對新架構的早期訪問權。這種關係產生了一個具體的里程碑——共同啟用了第一個 GB200 NVL72 十萬級 GPU 集群。該集群完成了多次大規模訓練運行,並為前沿規模的系統級可靠性設定了新基準。

GPT-5.5 正是該基礎設施全力運行的產物。

欲了解更多資訊,請參閱 OpenAI 的公告

Nvidia Blog

相關文章

其他收藏 · 0