Google 全新 Gemini Pro 模型再次創下基準測試紀錄

Techcrunch·2 個月前

Gemini 3.1 Pro 承諾提供一個能夠處理更複雜工作形式的 Google 大型語言模型。

使用超鳥優惠價，最高可節省 680 美元的通行證費用。立即註冊。

Disrupt 2026 通行證最高可省 680 美元。2 月 27 日截止。立即註冊。

主題

Google 的新 Gemini Pro 模型再次創下基準測試紀錄

Google 於週四發佈了其強大大型語言模型 (LLM) 的最新版本 Gemini Pro。該公司表示，3.1 版本目前以預覽版形式提供，並將於近期正式發佈。

Google 的新模型可能是迄今為止最強大的 LLM 之一。觀察家指出，Gemini 3.1 Pro 似乎比其前身 Gemini 3 有了巨大的進步——Gemini 3 在 11 月發佈時，就已被認為是一款能力極強的 AI 工具。

週四，Google 還分享了來自獨立基準測試的數據——例如名為「人類最後的考試」(Humanity’s Last Exam) 的測試——顯示其表現明顯優於之前的版本。

Gemini 3.1 Pro 也受到了 AI 新創公司 Mercor 執行長 Brendan Foody 的讚賞。該公司的基準測試系統 APEX 旨在衡量新 AI 模型執行實際專業任務的能力。「Gemini 3.1 Pro 現在位居 APEX-Agents 排行榜榜首，」Foody 在社群媒體貼文中表示，並補充說該模型令人印象深刻的結果顯示了「代理（Agents）在實際知識工作中的進步速度有多快」。

此次發佈正值 AI 模型大戰升溫之際，科技公司持續推出專為代理工作和多步驟推理設計的、功能日益強大的 LLM。其他主要競爭對手——包括 OpenAI 和 Anthropic——最近也發佈了新模型。

— Techcrunch

你的個人知識庫

Google 全新 Gemini Pro 模型再次創下基準測試紀錄

主題

更多來自 TechCrunch

Google 的新 Gemini Pro 模型再次創下基準測試紀錄