OpenAI 表示 GPT-5 在多種工作中可媲美人類表現

Techcrunch·

OpenAI 發布了名為 GDPval 的新基準測試,旨在評估 AI 模型在各行業中與人類專業人士的表現。初步結果顯示,GPT-5 和 Anthropic 的 Claude Opus 4.1 在工作品質上已接近行業專家的水平,儘管該基準目前僅涵蓋有限的現實工作任務。

暫無內容

Techcrunch

相關文章

其他收藏 · 0