將整個網路餵給AI公司的非營利組織
Hacker News·
Common Crawl 基金會這個非營利組織,透過抓取網路資料建立龐大資料庫,並將其免費提供給研究使用。然而,近年來,該資料庫被用於訓練 AI 公司的大型語言模型,其中更包含新聞網站的付費內容,且基金會疑似向出版商隱瞞此一用途。
暫無內容
相關文章
Common Crawl 基金會這個非營利組織,透過抓取網路資料建立龐大資料庫,並將其免費提供給研究使用。然而,近年來,該資料庫被用於訓練 AI 公司的大型語言模型,其中更包含新聞網站的付費內容,且基金會疑似向出版商隱瞞此一用途。
暫無內容
相關文章