newsence
GitHub Copilot 互動資料使用政策更新

GitHub Copilot 互動資料使用政策更新

Hacker News·11 天前

GitHub 首席產品官 Mario Rodriguez 宣布更新 Copilot 互動資料使用政策,同時強調他在 AI 策略與產品成長方面的領導地位。

背景

GitHub 產品長 Mario Rodriguez 近期宣布更新 GitHub Copilot 的互動數據使用政策。自 2024 年 4 月 24 日起,針對 Free、Pro 及 Pro+ 計畫的個人用戶,其使用 Copilot 時產生的互動數據(包含輸入、輸出、程式碼片段及相關上下文)將預設用於 AI 模型的訓練與改進,除非用戶主動選擇退出(opt-out)。

社群觀點

這項政策變更在 Hacker News 社群引發了強烈反彈,多數開發者對「預設開啟」的訓練機制感到不滿。社群成員指出,雖然 GitHub 聲稱不會訓練「靜態存放」的私有儲存庫內容,但由於 Copilot 在運作時必須處理當前編輯的程式碼,這意味著私有專案的邏輯與片段仍會被納入訓練範疇。部分用戶認為這種做法形同「過度擴權」,並質疑將付費用戶的數據預設用於商業模型訓練的合理性,認為既然已經支付訂閱費用,GitHub 應採取「預設關閉」並讓用戶主動選擇加入(opt-in)才符合誠信。

法律與隱私風險是討論的另一大焦點。有觀點質疑此舉在歐盟地區的合法性,擔心這可能違反當地的數據保護法規。開發者們特別憂慮敏感資訊外洩的風險,例如程式碼中的安全漏洞或智慧財產權,可能會在模型訓練後意外洩露給其他用戶。此外,GitHub 將數據共享範圍擴大至微軟旗下的關聯企業,也讓社群擔心數據流向變得更加難以監控。

有趣的是,社群中出現了關於「設定介面」的細節討論。有用戶發現 GitHub 在設定頁面中將「允許數據訓練」包裝成一種功能選項,若選擇禁用則顯示為「無法使用該功能」,這種將提供數據描述為一種「福利」的行銷口吻被批評為操弄辭令。不過,也有部分用戶為 GitHub 辯護,認為官方並未隱瞞此項變動,且在設定中提供明確的開關已算相對透明。

針對不同身分的差別待遇也引起討論。GitHub 官方人員在討論中證實,Business 與 Enterprise 企業用戶的數據受到合約保護,不會被用於模型訓練。這讓個人開發者感到被次等對待,甚至有資深開源貢獻者表示,由於 AI 模型在未經授權的情況下大量抓取受版權保護的程式碼,他已決定停止在 GitHub 發布開源專案,轉向更尊重開發者主權的平台。

延伸閱讀

在討論中,不滿 GitHub 政策的開發者推薦了替代方案,包括轉向使用 Codeberg 平台,或是採取自行託管(Self-hosting)Git 伺服器的方式來保護程式碼資產。此外,用戶也可以透過 GitHub 的功能設定頁面(github.com/settings/copilot/features)檢查並手動關閉數據共享選項。

https://github.blog/news-insights/company-news/updates-to-github-copilot-interaction-data-usage-policy/