METR 發布 Time Horizons 1.1

METR 發布 Time Horizons 1.1

Lesswrong·

我剛發現 METR 發布了 Time Horizons 1.1 更新版本,自 2023 年以來 50% 時間跨度的翻倍時間從 165 天縮短至 131 天。頂尖模型 Claude 3.5 Opus 的時間跨度也從 4 小時 49 分鐘增加到了 5 小時 20 分鐘。

我剛發現 METR 發布了他們時間跨度(time horizons)研究的更新版本,其中包含額外的任務和不同的評估基礎設施。這是在 1 月 29 日發布的,我認為其關注度被 Moltbook 的相關消息所掩蓋了。

主要重點:

  • 自 2021 年以來整體趨勢相似
  • 自 2023 年以來的期間內,50% 時間跨度的翻倍時間從 1.0 版本的 165 天縮短至 1.1 版本的 131 天
  • 頂尖模型 Claude 3.5 Opus 的時間跨度已從 4 小時 49 分鐘增加到 5 小時 20 分鐘

Lesswrong

相關文章

  1. Claude Opus 4.5 達成約 4 小時 49 分鐘的 50% 時間跨度

    4 個月前

  2. METR 的 14 小時 50% 時間跨度指標對經濟的影響將超過通用人工智慧預測時程

    2 個月前

  3. 如何「操縱」METR圖表

    4 個月前

  4. METR AI基準:釐清時間跨度的局限性

    Hacker News · 3 個月前

  5. AI 現已能處理大規模且易於驗證的軟體工程任務,我已將預測時間線提前

    16 天前