newsencenewsence
探索
歡迎

你的個人知識庫

從開放網路上發現值得讀的內容,收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。

了解更多

將整個網路餵給AI公司的非營利組織

Hacker News·6 個月前

Common Crawl 基金會這個非營利組織,透過抓取網路資料建立龐大資料庫,並將其免費提供給研究使用。然而,近年來,該資料庫被用於訓練 AI 公司的大型語言模型,其中更包含新聞網站的付費內容,且基金會疑似向出版商隱瞞此一用途。

暫無內容

— Hacker News

相關文章

  1. 將付費文章導向AI開發者的公司

    6 個月前

  2. AI爬取與開放網路

    4 個月前

  3. 創用 CC 宣布初步支持 AI「付費爬取」系統

    Techcrunch · 4 個月前

  4. AI的未償債務:大型語言模型爬蟲如何破壞開源的社會契約

    4 個月前

  5. 維基百科呼籲AI公司使用付費API並停止爬取內容

    Techcrunch · 5 個月前

相關文章

  1. 將付費文章導向AI開發者的公司

    6 個月前

  2. AI爬取與開放網路

    4 個月前

  3. 創用 CC 宣布初步支持 AI「付費爬取」系統

    Techcrunch · 4 個月前

  4. AI的未償債務:大型語言模型爬蟲如何破壞開源的社會契約

    4 個月前

  5. 維基百科呼籲AI公司使用付費API並停止爬取內容

    Techcrunch · 5 個月前