OpenAI 推出 GPT-5.4 mini 與 nano 模型

OpenAI·24 天前

我們今天正式發布 GPT-5.4 mini 與 nano，這是我們迄今為止最強大的小型模型。它們將 GPT-5.4 的多項優勢帶入更快速、更高效的模型中，專為高運算量的工作負載而設計。

2026 年 3 月 12 日

推出 GPT‑5.4 mini 與 nano

針對程式編寫與子代理（subagents）優化的快速且高效模型

今天我們正式發布 GPT‑5.4 mini 與 nano，這是我們迄今為止最強大的小型模型。它們將 GPT‑5.4 的許多優勢帶入更快速、更高效的模型中，專為高運算量的工作負載而設計。

GPT‑5.4 mini 在程式編寫、推理、多模態理解和工具使用方面較 GPT‑5 mini 有顯著提升，同時運行速度快了 2 倍以上。它在多項評估中（包括 SWE-Bench Pro 和 OSWorld-Verified）的表現也接近較大型的 GPT‑5.4 模型。

GPT‑5.4 nano 是 GPT‑5.4 體系中體積最小、價格最便宜的版本，適用於對速度和成本要求最高的任務。它同樣是 GPT‑5 nano 的重大升級。我們推薦將其用於分類、數據提取、排名以及處理簡單輔助任務的程式編寫子代理。

這些模型專為延遲直接影響產品體驗的工作負載而打造：需要即時響應的程式編寫助手、快速完成輔助任務的子代理、捕捉並解讀螢幕截圖的電腦操作系統，以及能即時對圖像進行推理的多模態應用。在這些場景中，最好的模型往往不是最大的模型，而是那些能夠快速響應、可靠地使用工具，且在複雜專業任務中依然表現出色的模型。

1 GPT‑5 mini 可用的最高推理努力值（reasoning_effort）為「高」。

以下是我們的客戶在工作流程中測試 GPT‑5.4 mini 和 nano 後的看法：

程式編寫

GPT‑5.4 mini 和 nano 在受益於快速迭代的程式編寫工作流中特別有效。這些模型能以低延遲處理針對性修改、程式碼庫導航、前端生成和調試循環，非常適合需要以更快速度和更低成本完成的程式編寫任務。

在基準測試中，GPT‑5.4 mini 在相似的延遲下表現持續優於 GPT‑5‑mini，並在運行速度大幅提升的同時，達到了接近 GPT‑5.4 等級的通過率，為程式編寫工作流提供了最強大的「性能-延遲」平衡方案之一。

我們透過觀察模型的生產行為並進行離線模擬來估算延遲。延遲估算考慮了工具調用時長（程式碼執行時間）、採樣標記（tokens）和輸入標記。實際延遲可能會因模擬中未涵蓋的許多因素而有顯著差異。同樣地，成本是根據撰寫本文時這些模型的 API 定價估算的。未來成本可能會有所變動。推理努力值涵蓋了從低到極高的範圍。

子代理

GPT‑5.4 mini 也非常適合結合不同規模模型的系統。例如在 Codex 中，較大的模型（如 GPT‑5.4）可以負責規劃、協調和最終判斷，同時將任務委派給 GPT‑5.4 mini 子代理，讓它們並行處理較窄的子任務——例如搜尋程式碼庫、審閱大型文件或處理輔助文檔。在文件⁠（在新視窗中開啟）中了解子代理在 Codex 中的運作方式。

隨著小型模型變得更快、更強大，這種模式變得更加實用。開發者不再將單一模型用於所有任務，而是可以構建組合系統，由大型模型決定做什麼，而由小型模型大規模地快速執行。GPT‑5.4 mini 是我們迄今為止針對此類工作流最強大的 mini 模型。

電腦操作

GPT‑5.4 mini 在多模態任務上表現同樣強勁，特別是與電腦操作相關的任務。該模型能快速解讀密集用戶界面的螢幕截圖，從而快速完成電腦操作任務。在 OSWorld-Verified 測試中，GPT‑5.4 mini 的表現接近 GPT‑5.4，同時大幅超越了 GPT‑5 mini。

可用性與定價

GPT‑5.4 mini 即日起可在 API、Codex 和 ChatGPT 中使用。

在 API 中，GPT‑5.4 mini 支持文本和圖像輸入、工具使用、函數調用、網路搜尋、文件搜尋、電腦操作和技能。它擁有 40 萬（400k）上下文窗口，每 100 萬個輸入標記成本為 0.75 美元，每 100 萬個輸出標記成本為 4.50 美元。

在 Codex 中，GPT‑5.4 mini 可在 Codex 應用程式、CLI、IDE 擴充功能和網頁版中使用。它僅消耗 GPT‑5.4 配額的 30%，讓開發者能以約三分之一的成本在 Codex 中快速處理較簡單的程式編寫任務。Codex 還可以委派給 GPT‑5.4 mini 子代理，以便在較便宜的模型上運行推理強度較低的工作。

在 ChatGPT 中，GPT‑5.4 mini 透過「+」選單中的「思考（Thinking）」功能提供給免費版和 Go 用戶。對於所有其他用戶，GPT‑5.4 mini 作為 GPT‑5.4 思考功能的頻率限制備援方案。

GPT‑5.4 nano 僅在 API 中提供，每 100 萬個輸入標記成本為 0.20 美元，每 100 萬個輸出標記成本為 1.25 美元。

有關模型安全防護的更多資訊，請查看我們部署安全中心⁠（在新視窗中開啟）上的系統卡補充文件。

1 GPT‑5 mini 可用的最高推理努力值（reasoning_effort）為「高」。

2 總體編輯距離（Overall Edit Distance）。OmniDocBench 運行時推理努力值設置為「無」，以反映低成本、低延遲的性能。

作者

延伸閱讀

Codex 不包含 SAST > 藝術卡片

產品 | 2026 年 3 月 16 日

學習區塊藝術卡片 1x1

產品 | 2026 年 3 月 10 日

Promptfoo > 封面圖片

公司 | 2026 年 3 月 9 日

https://openai.com/index/introducing-gpt-5-4-mini-and-nano