newsence
財務文件顯示:輝達將投入 260 億美元打造權重開放 AI 模型

財務文件顯示:輝達將投入 260 億美元打造權重開放 AI 模型

Wired - AI·25 天前

這項舉措可能使這家 AI 基礎設施巨頭迅速具備與 OpenAI、Anthropic 和 DeepSeek 競爭的能力。

根據 2025 年的一份財務申報文件,輝達(Nvidia)將在未來五年內投入 260 億美元用於構建開源人工智慧模型。輝達高層在接受《連線》(WIRED)雜誌採訪時證實了這一先前未經報導的消息。

這筆巨額投資可能使輝達從一家擁有強大軟體堆疊的晶片製造商,轉變為一家有能力與 OpenAI 和 DeepSeek 競爭的真正前沿實驗室。這是一項戰略舉措,由於這些模型是針對該公司的硬體進行調優的,因此可能進一步鞏固輝達作為全球領先 AI 晶片製造商的地位。

開源模型是指將決定模型行為的「權重」或參數公開發布的模型,有時還會附帶其架構和訓練細節。這允許任何人下載並在自己的機器或雲端運行。就輝達而言,該公司還揭露了構建和訓練其模型所涉及的技術創新,使新創公司和研究人員更容易修改並在該公司的創新基礎上進行開發。

週三,輝達還發布了 Nemotron 3 Super,這是其迄今為止功能最強大的權重開放(open-weight)AI 模型。這款新模型擁有 1,280 億個參數(衡量模型規模和複雜性的指標),使其大致相當於 OpenAI GPT-OSS 的最大版本,儘管該公司聲稱它在多項基準測試中表現優於 GPT-OSS 和其他模型。

具體而言,輝達聲稱 Nemotron 3 Super 在「人工智慧指數」(Artificial Intelligence Index)中獲得了 37 分,該指數對模型在 10 個不同基準測試中的表現進行評分。GPT-OSS 得分為 33 分,但幾款中國模型的得分更高。輝達表示,Nemotron 3 Super 在 PinchBench 上進行了秘密測試,這是一個評估模型控制 OpenClaw 能力的新基準測試,而該模型在該測試中排名第一。

輝達還介紹了用於訓練 Nemotron 3 的多項技術技巧。其中包括改進模型推理能力、長文本處理以及對強化學習響應能力的架構和訓練技術。

「輝達正更加嚴肅地對待開放模型開發,」輝達應用深度學習研究副總裁 Bryan Catanzaro 表示。「我們正在取得巨大進展。」

開放前沿

Meta 是 2023 年第一家發布開放模型 Llama 的大型 AI 公司。然而,執行長馬克·祖克柏(Mark Zuckerberg)最近重啟了公司的 AI 計畫,並暗示未來的模型可能不會完全開放。OpenAI 提供了一個名為 GPT-oss 的權重開放模型,但其性能遜於該公司最好的專有產品,且不適合進行修改。

來自 OpenAI、Anthropic 和 Google 的美國頂尖模型只能透過雲端或聊天介面訪問。相比之下,來自 DeepSeek、阿里巴巴、月之暗面(Moonshot AI)、零一萬物(Z.ai)和 MiniMax 的許多頂尖中國模型的權重都是公開且免費發布的。因此,全球許多新創公司和研究人員目前都在基於中國模型進行開發。

「幫助生態系統發展符合我們的利益,」Catanzaro 說。他於 2011 年加入輝達,並協助領導了公司從製造遊戲顯示卡到製造 AI 晶片的轉型。輝達於 2023 年 11 月發布了首款 Nemotron 模型。他補充說,輝達最近完成了一個 5,500 億參數模型的預訓練。(預訓練涉及將海量數據輸入到分佈在大量並行運行的專用晶片上的模型中。)此後,輝達發布了一系列專門用於機器人、氣候建模和蛋白質折疊等領域的模型。

企業生成式 AI 軟體副總裁 Kari Briski 表示,輝達未來的 AI 模型將不僅幫助公司改進晶片,還能改進其構建的超級電腦級數據中心。「我們構建它是為了擴展我們的系統,不僅測試計算能力,還測試存儲和網絡,並以此構建我們的硬體架構藍圖,」她說。

公開發布模型對輝達也可能具有長期戰略利益。該公司的晶片仍是訓練大型 AI 模型的金標準,客戶花費數十億美元購買該公司的硬體用於其數據中心。但如果中國的開放模型在競爭對手的硬體上表現出顯著進步,其崛起可能會在某個時刻侵蝕輝達的地位。

2025 年 1 月,DeepSeek 發布了一款尖端的開放模型,採用了更高效的方法,使其訓練成本大幅降低。此外,來自阿里巴巴等大公司以及月之暗面、零一萬物和 MiniMax 等新創公司的各種其他中國模型也在西方流行起來。阿里巴巴的 Qwen 模型易於使用、修改且維護良好,被研究人員和新創公司廣泛使用。

外界廣泛傳言,預計即將發布的 DeepSeek 新模型完全是在中國華為公司製造的晶片上訓練的,而華為正受到美國政府的制裁。如果屬實,這一發布可能會促使更多新創公司和研究人員嘗試華為的硬體,特別是在中國。

在這方面,輝達可以透過提供美國製造的權重開放模型來替代中國模型,從而幫助塑造美中之間的 AI 競爭。

「我們是一家美國公司,但我們與全球各地的公司合作,」Catanzaro 說。「讓各地的生態系統保持多樣化和強大符合我們的利益。」

一些行業專家警告說,看到開放創新轉向世界的另一端,長遠來看可能對美國不利。

「我是 Nemotron 的超級粉絲,」艾倫人工智慧研究所(Ai2)的 AI 研究員、領導 ATOM(美國真正開放模型)項目的 Nathan Lambert 說。Lambert 補充說,美國政府也應該資助開放模型。

Laude Institute(一家致力於推動 AI 開放性的非營利組織)負責人、電腦科學家兼企業家 Andy Konwinski 表示,輝達的投資意義重大,因為它處於 AI 研究的核心地位。「他們站在眾多開放和封閉 AI 工作的最前沿,」Konwinski 說。「這是他們對開放性信念的前所未有的信號。」

https://wired.com/story/nvidia-investing-26-billion-open-source-models/