
OpenAI 推出 GPT-5.4 mini 與 nano 模型
我們今天正式發布 GPT-5.4 mini 與 nano,這是我們迄今為止最強大的小型模型。它們將 GPT-5.4 的多項優勢帶入更快速、更高效的模型中,專為高運算量的工作負載而設計。
2026 年 3 月 12 日
推出 GPT‑5.4 mini 與 nano
針對程式編寫與子代理(subagents)優化的快速且高效模型
今天我們正式發布 GPT‑5.4 mini 與 nano,這是我們迄今為止最強大的小型模型。它們將 GPT‑5.4 的許多優勢帶入更快速、更高效的模型中,專為高運算量的工作負載而設計。
GPT‑5.4 mini 在程式編寫、推理、多模態理解和工具使用方面較 GPT‑5 mini 有顯著提升,同時運行速度快了 2 倍以上。它在多項評估中(包括 SWE-Bench Pro 和 OSWorld-Verified)的表現也接近較大型的 GPT‑5.4 模型。
GPT‑5.4 nano 是 GPT‑5.4 體系中體積最小、價格最便宜的版本,適用於對速度和成本要求最高的任務。它同樣是 GPT‑5 nano 的重大升級。我們推薦將其用於分類、數據提取、排名以及處理簡單輔助任務的程式編寫子代理。
這些模型專為延遲直接影響產品體驗的工作負載而打造:需要即時響應的程式編寫助手、快速完成輔助任務的子代理、捕捉並解讀螢幕截圖的電腦操作系統,以及能即時對圖像進行推理的多模態應用。在這些場景中,最好的模型往往不是最大的模型,而是那些能夠快速響應、可靠地使用工具,且在複雜專業任務中依然表現出色的模型。
1 GPT‑5 mini 可用的最高推理努力值(reasoning_effort)為「高」。
以下是我們的客戶在工作流程中測試 GPT‑5.4 mini 和 nano 後的看法:
程式編寫
GPT‑5.4 mini 和 nano 在受益於快速迭代的程式編寫工作流中特別有效。這些模型能以低延遲處理針對性修改、程式碼庫導航、前端生成和調試循環,非常適合需要以更快速度和更低成本完成的程式編寫任務。
在基準測試中,GPT‑5.4 mini 在相似的延遲下表現持續優於 GPT‑5‑mini,並在運行速度大幅提升的同時,達到了接近 GPT‑5.4 等級的通過率,為程式編寫工作流提供了最強大的「性能-延遲」平衡方案之一。
我們透過觀察模型的生產行為並進行離線模擬來估算延遲。延遲估算考慮了工具調用時長(程式碼執行時間)、採樣標記(tokens)和輸入標記。實際延遲可能會因模擬中未涵蓋的許多因素而有顯著差異。同樣地,成本是根據撰寫本文時這些模型的 API 定價估算的。未來成本可能會有所變動。推理努力值涵蓋了從低到極高的範圍。
子代理
GPT‑5.4 mini 也非常適合結合不同規模模型的系統。例如在 Codex 中,較大的模型(如 GPT‑5.4)可以負責規劃、協調和最終判斷,同時將任務委派給 GPT‑5.4 mini 子代理,讓它們並行處理較窄的子任務——例如搜尋程式碼庫、審閱大型文件或處理輔助文檔。在文件(在新視窗中開啟)中了解子代理在 Codex 中的運作方式。
隨著小型模型變得更快、更強大,這種模式變得更加實用。開發者不再將單一模型用於所有任務,而是可以構建組合系統,由大型模型決定做什麼,而由小型模型大規模地快速執行。GPT‑5.4 mini 是我們迄今為止針對此類工作流最強大的 mini 模型。
電腦操作
GPT‑5.4 mini 在多模態任務上表現同樣強勁,特別是與電腦操作相關的任務。該模型能快速解讀密集用戶界面的螢幕截圖,從而快速完成電腦操作任務。在 OSWorld-Verified 測試中,GPT‑5.4 mini 的表現接近 GPT‑5.4,同時大幅超越了 GPT‑5 mini。
可用性與定價
GPT‑5.4 mini 即日起可在 API、Codex 和 ChatGPT 中使用。
在 API 中,GPT‑5.4 mini 支持文本和圖像輸入、工具使用、函數調用、網路搜尋、文件搜尋、電腦操作和技能。它擁有 40 萬(400k)上下文窗口,每 100 萬個輸入標記成本為 0.75 美元,每 100 萬個輸出標記成本為 4.50 美元。
在 Codex 中,GPT‑5.4 mini 可在 Codex 應用程式、CLI、IDE 擴充功能和網頁版中使用。它僅消耗 GPT‑5.4 配額的 30%,讓開發者能以約三分之一的成本在 Codex 中快速處理較簡單的程式編寫任務。Codex 還可以委派給 GPT‑5.4 mini 子代理,以便在較便宜的模型上運行推理強度較低的工作。
在 ChatGPT 中,GPT‑5.4 mini 透過「+」選單中的「思考(Thinking)」功能提供給免費版和 Go 用戶。對於所有其他用戶,GPT‑5.4 mini 作為 GPT‑5.4 思考功能的頻率限制備援方案。
GPT‑5.4 nano 僅在 API 中提供,每 100 萬個輸入標記成本為 0.20 美元,每 100 萬個輸出標記成本為 1.25 美元。
有關模型安全防護的更多資訊,請查看我們部署安全中心(在新視窗中開啟)上的系統卡補充文件。
1 GPT‑5 mini 可用的最高推理努力值(reasoning_effort)為「高」。
2 總體編輯距離(Overall Edit Distance)。OmniDocBench 運行時推理努力值設置為「無」,以反映低成本、低延遲的性能。
作者
延伸閱讀

產品 | 2026 年 3 月 16 日

產品 | 2026 年 3 月 10 日

公司 | 2026 年 3 月 9 日