xAI 的大好消息:Grok 現在非常擅長回答關於《柏德之門》的問題了

xAI 的大好消息:Grok 現在非常擅長回答關於《柏德之門》的問題了

Techcrunch·

Business Insider 的一份新報告顯示,xAI 的高階工程師被從其他項目中抽調出來,以確保 Grok 能夠回答關於電子遊戲《柏德之門》的詳細問題。

使用超級早鳥優惠,最高可節省 680 美元的通行證費用。立即註冊。

Disrupt 2026 通行證最高可省 680 美元。2 月 27 日截止。立即註冊。

圖片

圖片

主題

最新消息

人工智慧 (AI)

亞馬遜 (Amazon)

應用程式 (Apps)

生物技術與健康

氣候

雲端運算

商業

加密貨幣

企業

電動車 (EVs)

金融科技

募資

小工具

遊戲

Google

政府與政策

硬體

Instagram

裁員

媒體與娛樂

Meta

微軟 (Microsoft)

隱私

機器人

安全

社交

太空

新創公司

TikTok

交通

創投

更多來自 TechCrunch

團隊

活動

Startup Battlefield

StrictlyVC

電子報

播客 (Podcasts)

影片

合作夥伴內容

TechCrunch 品牌工作室

Crunchboard

聯繫我們

圖片

xAI 的大好消息:Grok 現在非常擅長回答關於《柏德之門》的問題

不同的 AI 實驗室有不同的優先事項。例如,OpenAI 傳統上專注於消費者用戶,而其競爭對手 Anthropic 則傾向於瞄準企業。我們最近發現,伊隆·馬斯克(Elon Musk)的 xAI 一直特別強調電動遊戲攻略。

上週五,《商業內幕》(Business Insider)的 Grace Kay 發表了一份關於 xAI 的詳盡且影響深遠的報告。這家 AI 新創公司最近剛被 SpaceX 收購,報告特別強調了馬斯克如何讓員工的工作變得困難。但其中一個軼聞特別引人注目:

據知情人士透露,在去年的一個案例中,由於馬斯克對聊天機器人回答有關電動遊戲《柏德之門》(Baldur’s Gate)細節問題的方式感到不滿,導致一個模型的發佈推遲了數天。據稱,高階工程師被從其他項目中抽調出來,專門在發佈前優化這些回答。

當然,你可以想像任何受人尊敬且經驗豐富的工程師會有多沮喪——他上班時以為自己要解決的是知識和機器智能的根本問題,結果卻被支使去幫助一個 54 歲的男人打通他的電動遊戲。但這個軼聞提出了一個更迫切的問題:馬斯克最終得到了他想要的遊戲技能嗎?

為了回答這個問題,我們內部的 RPG 愛好者 Ram Iyer 準備了一套關於《柏德之門》的五個一般性問題,我們將這些問題交給 xAI 和其他三個主要模型進行測試,這是一種我決定稱之為「BaldurBench」的準基準測試。

為了新聞透明度,我已將所有聊天記錄公開,你可以在這裡查看:Grok、ChatGPT、Claude 和 Gemini。

首先是好消息:Grok 實際上提供了相當不錯的資訊。它的回答中充滿了遊戲術語——例如用「save-scumming」(存檔讀檔大法)代替存檔,用「DPS」代替傷害——但只要你知道它在說什麼,這些答案既實用又專業。Grok 還非常喜歡表格和理論計算(theorycraft),這與你的預期差不多。

網路上有很多《柏德之門》的攻略,而這些模型基本上都從相同的來源提取資料,因此最大的差異在於風格。ChatGPT 偏好項目符號列表和句子片段,而 Gemini 則喜歡加粗重要詞彙。

最大的驚喜是 Claude,它特別擔心會給我提供劇透資訊,從而破壞我的遊戲體驗。當我詢問良好的隊伍配置時,它在建議的結尾說:「不要壓力太大,玩你覺得有趣的就好。」謝了,Claude!

重要的是要記住,根據《商業內幕》的報導,我們知道這是 xAI 特別專注於追趕競爭對手的領域。因此,我們不應過度解讀在報導的「衝刺」之後,Grok 的建議與其他模型表現相當這一事實。儘管如此,知道 xAI 只要努力就能做到這一點,還是件好事。

Techcrunch

相關文章

  1. xAI 的「安全」是否已死?

    3 個月前

  2. xAI 完成 200 億美元 E 輪融資

    4 個月前

  3. X 在面臨透明度罰款與 Grok 爭議之際開源其演算法

    3 個月前

  4. 聯盟要求聯邦禁止 Grok AI,因其生成未經同意的性內容

    3 個月前

  5. AI 編碼研發受挫,馬斯克排擠更多 xAI 創始成員

    Hacker News · 大約 2 個月前