Anthropic releases Sonnet 4.6

Anthropic releases Sonnet 4.6

Techcrunch·

Anthropic has released a new version of its mid-size Sonnet model, keeping pace with the company's four-month update cycle.

圖片

圖片

主題

最新

AI

Amazon

Apps

Biotech & Health

Climate

Cloud Computing

Commerce

Crypto

Enterprise

EVs

Fintech

Fundraising

Gadgets

Gaming

Google

Government & Policy

Hardware

Instagram

Layoffs

Media & Entertainment

Meta

Microsoft

Privacy

Robotics

Security

Social

Space

Startups

TikTok

Transportation

Venture

更多來自 TechCrunch

Staff

Events

Startup Battlefield

StrictlyVC

Newsletters

Podcasts

Videos

Partner Content

TechCrunch Brand Studio

Crunchboard

Contact Us

發布時間:

圖片

圖片

Anthropic 發布 Sonnet 4.6

Anthropic 發布了其中型 Sonnet 模型的新版本,與該公司四個月的更新週期保持一致。在一篇宣布新模型的文章中,Anthropic 強調了在編碼、指令遵循和電腦使用方面的改進。

Sonnet 4.6 將成為 Free 和 Pro 方案用戶的預設模型。

Sonnet 4.6 的 Beta 版本將包含 100 萬個 token 的上下文窗口,是之前 Sonnet 可用最大窗口的兩倍。Anthropic 將新的上下文窗口描述為「足以在單個請求中容納整個程式碼庫、冗長的合約或數十篇研究論文。」

此次發布距離 Opus 4.6 的推出僅兩週,更新後的 Haiku 模型可能在未來幾週內推出。

此次發布帶來了一系列新的記錄基準分數,包括用於電腦使用的 OS World 和用於軟體工程的 SWE-Bench。但或許最令人印象深刻的是其在 ARC-AGI-2 上的 60.4% 分數,旨在衡量人類智慧特有的技能。該分數使 Sonnet 4.6 高於大多數同類模型,儘管它仍然落後於 Opus 4.6、Gemini 3 Deep Think 和 GPT 5.2 的一個精煉版本等模型。

Techcrunch

相關文章

  1. Claude Sonnet 4.6

    Hacker News · 2 個月前

  2. 推出 Claude Sonnet 4.6

    Hacker News · 2 個月前

  3. Anthropic 發布 Opus 4.6,引入全新「代理團隊」功能

    3 個月前

  4. Anthropic 推出 Claude Sonnet 4.6:全面提升程式編寫與電腦操作能力

    Hacker News · 2 個月前

  5. Sonnet 4.6 錯誤率上升

    Hacker News · 15 天前