研究發現：AI能力可能因有缺陷的基準測試而被誇大

Hacker News·6 個月前

牛津網際網路研究所的一項新研究指出，許多流行的AI基準測試工具不可靠且具誤導性，可能誇大了AI的能力。研究人員發現，這些基準測試常缺乏清晰的定義和統計透明度，導致對AI表現的評估不準確。

暫無內容

— Hacker News

相關文章