
Mistral 押注「自建 AI」模式,在企業市場挑戰 OpenAI 與 Anthropic
Mistral Forge 讓企業能利用自身數據從頭開始訓練客製化 AI 模型,挑戰那些依賴微調和檢索增強生成技術的競爭對手。
大多數企業 AI 專案失敗的原因並非缺乏技術,而是因為他們使用的模型不了解其業務。這些模型通常是在網際網路數據上訓練的,而非基於公司數十年的內部文件、工作流程和機構知識。
這道鴻溝正是法國 AI 初創公司 Mistral 看到的機會。週二,該公司宣布推出 Mistral Forge,這是一個讓企業能夠利用自身數據訓練自定義模型的平台。Mistral 在 Nvidia GTC(Nvidia 的年度技術大會)上宣布了這一平台,今年的大會重點聚焦於 AI 和企業級代理模型(agentic models)。
對於 Mistral 來說,這是一個目標明確的舉動。該公司一直將業務建立在企業客戶之上,而競爭對手 OpenAI 和 Anthropic 則在消費者普及率方面遙遙領先。執行長 Arthur Mensch 表示,Mistral 對企業市場的專注正在奏效:該公司今年的年度經常性收入(ARR)有望突破 10 億美元。
Mistral 表示,加倍投入企業市場的一個重要部分是賦予公司對其數據和 AI 系統更多的控制權。
「Forge 的作用是讓企業和政府能夠根據其特定需求自定義 AI 模型,」Mistral 產品負責人 Elisa Salamanca 告訴 TechCrunch。
企業 AI 領域的幾家公司已經聲稱提供類似的功能,但大多數都集中在微調現有模型,或通過檢索增強生成(RAG)等技術在模型之上疊加專有數據。這些方法並未從根本上重新訓練模型;相反,它們是在運行時使用公司數據對模型進行調整或查詢。
相比之下,Mistral 表示它正賦予公司從零開始訓練模型的能力。理論上,這可以解決一些常見方法的局限性——例如,更好地處理非英語或高度特定領域的數據,以及對模型行為進行更強的控制。它還可能允許公司使用強化學習來訓練代理系統,並減少對第三方模型供應商的依賴,從而規避模型變更或停用等風險。
Forge 客戶可以使用 Mistral 廣泛的開源權重 AI 模型庫來構建自定義模型,其中包括最近推出的 Mistral Small 4 等小型模型。根據 Mistral 聯合創始人兼首席技術官 Timothée Lacroix 的說法,Forge 可以幫助從現有模型中釋放更多價值。
「我們在構建較小模型時所做的權衡是,它們在每個主題上都無法像大型模型那樣優秀,因此自定義能力讓我們能夠選擇強調什麼以及捨棄什麼,」Lacroix 說。
Lacroix 表示,Mistral 會就使用哪些模型和基礎設施提供建議,但這兩項決定權都掌握在客戶手中。對於需要更多指導的團隊,Forge 配備了 Mistral 的前線部署工程師(FDE)團隊,他們直接派駐到客戶端,以挖掘正確的數據並適應其需求——這是一種借鑒自 IBM 和 Palantir 等公司的模式。
「作為一項產品,Forge 已經配備了所有工具和基礎設施,因此你可以生成合成數據流水線,」Salamanca 說。「但了解如何建立正確的評估機制,並確保擁有正確數量的數據,是企業通常缺乏專業知識的地方,而這正是 FDE 所能提供的價值。」
Mistral 已經向包括愛立信(Ericsson)、歐洲太空總署(European Space Agency)、義大利諮詢公司 Reply 以及新加坡的 DSO 和 HTX 在內的合作夥伴開放了 Forge。早期採用者還包括荷蘭晶片製造設備商 ASML,該公司在去年 9 月領投了 Mistral 的 C 輪融資,當時估值為 117 億歐元(當時約合 138 億美元)。
這些合作夥伴關係代表了 Mistral 對 Forge 主要應用場景的預期。根據 Mistral 首席營收官 Marjorie Janiewicz 的說法,這些場景包括:需要針對其語言和文化量身定制模型的政府;具有高合規要求的金融機構;有自定義需求的製造商;以及需要根據其代碼庫調整模型的科技公司。