ChatGPT 全新的 Images 2.0 模型在文字生成表現上令人驚豔

ChatGPT 全新的 Images 2.0 模型在文字生成表現上令人驚豔

Techcrunch·

OpenAI 最新的圖像生成模型 ChatGPT Images 2.0 展示了過去幾年 AI 能力的演進程度,它能精準生成菜單等包含文字的圖像,不再像以往的模型會出現拼字錯誤。

過去要區分人類製作與 AI 生成的圖像相當容易——就在兩年前,你還無法使用圖像模型為墨西哥餐廳製作菜單,而不創造出像「enchuita」、「churiros」、「burrto」和「margartas」這類全新的「創意料理」。

現在,當我要求全新的 ChatGPT Images 2.0 模型製作一份墨西哥菜單時,它生成的內容可以立即在餐廳使用,而顧客甚至不會察覺有異。(不過,標價 13.50 美元的生魚片(ceviche)可能會讓我懷疑魚肉的品質)。

Image

作為對比,這是兩年前我從 DALL-E 3 得到的結果。(當時 ChatGPT 還無法生成圖像):

Image

AI 圖像生成器歷來在拼字方面表現掙扎,因為它們通常使用擴散模型(diffusion models),其運作原理是從雜訊中重建圖像。

「擴散模型是在重建給定的輸入,」Lesan AI 的創辦人兼執行長 Asmelash Teka Hadgu 在 2024 年告訴 TechCrunch。「我們可以假設圖像上的文字只是極小的一部分,因此圖像生成器學習的是涵蓋更多像素的模式。」

此後,研究人員探索了其他圖像生成機制,例如自回歸模型(autoregressive models),這類模型會對圖像應有的樣子進行預測,運作方式更接近大型語言模型(LLM)。

遺憾的是,OpenAI 在本週的新聞發佈會上拒絕回答關於驅動 ChatGPT Images 2.0 的模型類型的問題。

在 Disrupt 會見您的下一位投資者或新創投資組合

您的下一輪融資、下一位員工、下一個突破機會。盡在 TechCrunch Disrupt 2026。屆時將有超過 10,000 名創辦人、投資者和科技領袖齊聚一堂,參加為期三天、超過 250 場的實戰課程、強大的引薦以及定義市場的創新活動。立即註冊,最高可節省 410 美元。

在 Disrupt 會見您的下一位投資者或新創投資組合

您的下一輪融資、下一位員工、下一個突破機會。盡在 TechCrunch Disrupt 2026。屆時將有超過 10,000 名創辦人、投資者和科技領袖齊聚一堂,參加為期三天、超過 250 場的實戰課程、強大的引薦以及定義市場的創新活動。立即註冊,最高可節省 410 美元。

然而,該公司解釋說,新模型具有「思考能力」,使其能夠搜尋網路、根據一個提示詞製作多張圖像,並對其創作進行雙重檢查——這使得 Images 2.0 能夠創建各種尺寸的行銷素材,以及多格漫畫。

OpenAI 還表示,Images 對日語、韓語、印地語和孟加拉語等非拉丁文字的渲染有更強的理解力。該模型的知識截止日期為 2025 年 12 月,這可能會影響它生成涉及近期新聞的特定提示詞的準確性。

「Images 2.0 為圖像創作帶來了前所未有的精確度和忠實度。它不僅能構思更複雜的圖像,還能有效地將願景變為現實,能夠遵循指令、保留要求的細節,並渲染經常讓圖像模型崩潰的細微元素:小文字、圖標、UI 元素、密集構圖和微妙的風格限制,解析度最高可達 2K,」OpenAI 在新聞稿中表示。

這些功能意味著圖像生成的速度不像在 ChatGPT 中輸入問題那麼快,但生成像多格漫畫這樣複雜的內容仍只需幾分鐘。

所有 ChatGPT 和 Codex 用戶將從週二開始可以使用 Images 2.0;付費用戶將能生成更進階的輸出。該公司還將提供 gpt-image-2 API,定價取決於輸出的品質和解析度。

主題

當您透過我們文章中的連結購買時,我們可能會賺取小額佣金。這不會影響我們的編輯獨立性。

Amanda Silberling

資深記者

Amanda Silberling 是 TechCrunch 的資深記者,報導科技與文化的交匯點。她也曾為 Polygon、MTV、Kenyon Review、NPR 和 Business Insider 等刊物撰稿。她是關於網路文化的播客《Wow If True》的共同主持人,搭檔是科幻小說作家 Isabel J. Kim。在加入 TechCrunch 之前,她曾擔任基層組織者、博物館教育工作者和電影節協調員。她擁有賓夕法尼亞大學英語學士學位,並曾擔任普林斯頓亞洲協會(Princeton in Asia)駐寮國研究員。

您可以透過電子郵件 amanda@techcrunch.com 聯繫 Amanda 或核實其外聯資訊,或透過 Signal 加密訊息 @amanda.100 聯繫。

StrictlyVC 在舊金山開啟新的一年。加入我們,參與與產業領袖的坦誠爐邊對談,獲取創投內幕見解,並建立真正能推動發展的高價值聯繫。門票有限。

Techcrunch

相關文章

其他收藏 · 0