AI 基準測試是個糟糕的笑話 – 而大型語言模型製造商才是笑到最後的人

Hacker News·6 個月前

一項研究發現，大部分用於自然語言處理和機器學習的 AI 基準測試存在缺陷，質疑了大型語言模型開發商所聲稱的性能表現的有效性。

暫無內容

— Hacker News

相關文章