從開放網路上發現值得讀的內容,收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。
此貼文介紹了Kodus,一個旨在評估大型語言模型(LLMs)在程式碼審查任務上的基準。作者正在尋求社群對此新基準的意見回饋。
暫無內容
— Hacker News
相關文章
Kodus:開源AI程式碼審查,防止生產環境出錯
Product Hunt - AI · 6 個月前
為AI時代重塑同行評審
9 個月前
Show HN:CodeLens.AI – 社群基準測試,比較 6 款 LLM 在真實程式碼任務上的表現
7 個月前
研究發現AI系統評估方法存在弱點
6 個月前
大型語言模型作為新的高階語言
3 個月前