將整個網路餵給AI公司的非營利組織

Hacker News·6 個月前

Common Crawl 基金會這個非營利組織，透過抓取網路資料建立龐大資料庫，並將其免費提供給研究使用。然而，近年來，該資料庫被用於訓練 AI 公司的大型語言模型，其中更包含新聞網站的付費內容，且基金會疑似向出版商隱瞞此一用途。

暫無內容

— Hacker News

相關文章