我贏得了一場不存在的錦標賽：我如何學會污染大型語言模型供應鏈

Hacker News·大約 7 小時前

我透過修改維基百科並註冊個人網域，成功偽造了一個世界冠軍頭銜並讓多個頂尖語言模型採信，這揭示了人工智慧檢索增強生成機制在信任模型上的嚴重漏洞。

How I Won a Championship That Doesnt Exist

背景

本文作者分享了他如何透過註冊一個虛假網站並在維基百科（Wikipedia）進行小幅編輯，成功讓多款主流大型語言模型（LLM）誤認他為 2025 年「6 Nimmt!」紙牌遊戲的世界冠軍。這項實驗揭示了當前 AI 檢索增強生成（RAG）技術的脆弱性，即攻擊者只需極低成本便能透過「循環引用」誤導 AI 的事實判斷，進而污染整個資訊供應鏈。

社群觀點

Hacker News 的討論圍繞著這類「資訊投毒」的本質及其對未來社會的影響。許多留言者指出，這並非 LLM 特有的問題，而是人類資訊傳播史的延續。從印刷機發明到 Google 搜尋時代，SEO 操弄與虛假訊息始終存在，只是 AI 加速了傳播速度並降低了門檻。有觀點認為，這種行為本質上是維基百科長期存在的「引用起源」（Citogenesis）現象，即虛假資訊在維基百科被引用後，逐漸被其他媒體視為真理，最終形成無法追溯來源的偽事實。

部分討論者對作者的行為持保留態度，認為這類實驗帶有「盧德主義」色彩，甚至有破壞維基百科公共信用之嫌。他們將此比喻為在馬路上亂丟石頭來證明開車很危險，雖然確實揭露了風險，但也對基礎設施造成了負擔。然而，支持者反駁這類研究極具價值，因為它展示了 LLM 在面對「全新且不具衝突性」的資訊時幾乎毫無防禦能力。比起扭曲已知的歷史事實，製造全新的虛假敘事（如虛構的獎項或醜聞）更容易被 AI 採信，因為模型在訓練數據中找不到反證。

社群也對「信任」的轉移感到憂慮。過去人們信任大英百科全書或知名新聞品牌，後來轉向信任搜尋引擎的排名，現在則開始盲目信任 AI 生成的權威口吻。留言中提到，許多使用者已經開始將 AI 視為真理來源，甚至在爭論中引用 AI 的回答作為論據。這種「修辭技巧」短路了人類的理性判斷，使得驗證來源變得更加困難。更有討論者指出，如果個人能以 12 美元的成本達成此目的，那麼擁有龐大資源的國家級組織或公關公司，將能更輕易地重寫歷史或進行大規模的輿論操弄。

最後，有留言者分享了類似的親身經歷，例如在 Reddit 上的錯誤技術假設幾年後被 AI 當作解決方案引用，或是透過單一部落格文章成功為一頭鯨魚命名並被 Google 採納。這些案例共同指向一個共識：在 AI 時代，品牌信譽與源頭驗證將變得比以往任何時候都更重要，因為當底層數據被污染時，再強大的模型也無法分辨真偽。

你的個人知識庫

我贏得了一場不存在的錦標賽：我如何學會污染大型語言模型供應鏈

背景

社群觀點

延伸閱讀