Google 全新 Gemini Pro 模型再次創下基準測試紀錄

Google 全新 Gemini Pro 模型再次創下基準測試紀錄

Techcrunch·

Gemini 3.1 Pro 承諾提供一個能夠處理更複雜工作形式的 Google 大型語言模型。

使用超鳥優惠價,最高可節省 680 美元的通行證費用。立即註冊。

Disrupt 2026 通行證最高可省 680 美元。2 月 27 日截止。立即註冊。

圖片

圖片

主題

最新消息

人工智慧 (AI)

亞馬遜 (Amazon)

應用程式 (Apps)

生物技術與健康

氣候

雲端運算

商業

加密貨幣

企業

電動車 (EVs)

金融科技 (Fintech)

募資

小工具 (Gadgets)

遊戲

Google

政府與政策

硬體

Instagram

裁員

媒體與娛樂

Meta

微軟 (Microsoft)

隱私

機器人

安全

社群

太空

新創公司

TikTok

交通

風險投資

更多來自 TechCrunch

團隊成員

活動

Startup Battlefield

StrictlyVC

電子報

播客 (Podcasts)

影片

合作夥伴內容

TechCrunch 品牌工作室

Crunchboard

聯繫我們

發佈於:

圖片

圖片

Google 的新 Gemini Pro 模型再次創下基準測試紀錄

Google 於週四發佈了其強大大型語言模型 (LLM) 的最新版本 Gemini Pro。該公司表示,3.1 版本目前以預覽版形式提供,並將於近期正式發佈。

Google 的新模型可能是迄今為止最強大的 LLM 之一。觀察家指出,Gemini 3.1 Pro 似乎比其前身 Gemini 3 有了巨大的進步——Gemini 3 在 11 月發佈時,就已被認為是一款能力極強的 AI 工具。

週四,Google 還分享了來自獨立基準測試的數據——例如名為「人類最後的考試」(Humanity’s Last Exam) 的測試——顯示其表現明顯優於之前的版本。

Gemini 3.1 Pro 也受到了 AI 新創公司 Mercor 執行長 Brendan Foody 的讚賞。該公司的基準測試系統 APEX 旨在衡量新 AI 模型執行實際專業任務的能力。「Gemini 3.1 Pro 現在位居 APEX-Agents 排行榜榜首,」Foody 在社群媒體貼文中表示,並補充說該模型令人印象深刻的結果顯示了「代理(Agents)在實際知識工作中的進步速度有多快」。

此次發佈正值 AI 模型大戰升溫之際,科技公司持續推出專為代理工作和多步驟推理設計的、功能日益強大的 LLM。其他主要競爭對手——包括 OpenAI 和 Anthropic——最近也發佈了新模型。

Techcrunch

相關文章

  1. Gemini 3.1 Pro 模型說明文檔

    Hacker News · 2 個月前

  2. Gemini 3.1 Pro:為處理最複雜任務而生的更聰明模型

    Hacker News · 2 個月前

  3. Google 推出 Gemini 3 Flash 模型,並將其設為 Gemini 應用程式的預設模型

    4 個月前

  4. Gemini 3.1 Pro 預覽版

    Hacker News · 2 個月前

  5. Gemini 3.1 Pro:應對最複雜任務的更智慧模型

    Product Hunt - AI · 2 個月前