
檢測工具指稱:教宗對人工智慧的警告竟是由人工智慧生成的
Pangram Labs 更新的 Chrome 擴充功能可在您滾動社群饋送時,為人工智慧產生的垃圾內容貼上警告標籤。
週一,一個全新的 Reddit 帳號出現在廣受歡迎的 r/AmItheAsshole 論壇上,該論壇專供用戶讓陌生人仲裁其個人糾紛。這位用戶詢問,他們「因為有自己的工作和責任而拒絕幫繼母照顧小孩」是否越界了。貼文本身簡潔、直接且語法正確,解釋了該用戶的繼母和父親經常期望他們在臨時通知下提供托兒服務,最終導致了爭吵。
「現在家裡氣氛很緊張,我開始懷疑自己的處理方式是否不當,」這位 Redditor 總結道。「我明白養育孩子壓力很大,但我也覺得我不應該有義務承擔那種並非我角色的責任。」對此人的回應大多表示支持:許多人回覆說,孩子不是他們要照顧的,搬出家門將是最好的做法。
但根據 Pangram Labs 開發的 AI 檢測軟體——該軟體聲稱準確率達 99.98%,誤報率僅為萬分之一——這個關於家庭不和的原創故事是由 AI 生成的。
我在瀏覽頁面時發現它被標記為 AI 內容,這要歸功於 Pangram 本週向公眾推出的最新版 Chrome 擴充功能;在每月 20 美元的付費級別下,該工具會即時掃描包括 Reddit、X、LinkedIn、Medium 和 Substack 在內的社交網站貼文,並將其標記為人類撰寫、AI 生成或在 AI 協助下起草。分析還包括 Pangram 對結論的信心程度:低、中或高。
研究人員發現網路各處充斥著 AI 垃圾(AI slop)。它同時損害了新聞業和社交平台。根據史丹佛大學、倫敦帝國學院和網路檔案館(Internet Archive)研究人員本月發表的一項研究,截至 2025 年,至少部分由 AI 生成的文本佔所有新網站的三分之一以上。(研究人員使用早期的 Pangram 工具得出了他們的發現。)
Pangram 的執行長、自封為「垃圾清潔工」的 Max Spero 正是想幫助清理這片混亂。他告訴《連線》(WIRED),在公司的瀏覽器擴充功能中加入即時分析,為人們提供了一種更無縫的方式來檢查他們常造訪網站上的 AI 內容。
「透過提供主動檢查,對於那些普遍在意不想看到垃圾內容的人來說,這會更有用,」Spero 解釋道。「把文字複製貼上到外部工具是一件很費勁的事。人們就是不會那樣做。」
當然,虛構的情節在 r/AmItheAsshole 等子版塊中並不罕見,那裡的網路釣魚者(trolls)常發布由極其荒謬的虛構故事組成的誘餌貼文。然而,即使是敏銳的讀者,可能也不會懷疑像上述那樣相對平淡的敘述可能是偽造的。(分享該貼文的 Redditor 並未回應關於是否使用 AI 或希望透過該貼文達成什麼目的的置評請求,該貼文隨後已被刪除。)
雖然沒有任何 AI 檢測系統是完美的,但 Pangram 的系統被幾所大學的第三方研究人員認為是最穩定且準確的;芝加哥大學 2025 年一項審核 AI 檢測軟體的研究給予 Pangram 最高評分,並指出其誤報率幾乎為零,尤其是在較長的段落上。Spero 表示,它優於競爭對手的原因之一是,它部分是針對「更接近 AI 與人類邊界的困難案例」進行訓練的。我在對《連線》發表的文章進行測試時,無法讓它產生誤報。
Pangram 強化版的 Chrome 工具迅速揭示了你在網路上日常接觸到的內容中,有多少可能是 AI 生成的。
一個特別令人驚訝的例子:Pangram 的工具顯示,教宗的官方 X 帳號似乎充斥著 AI 文本,甚至在教宗討論 AI 對神聖人類精神構成的威脅的討論串中也是如此。
4 月 17 日,@Pontifex 帳號分享了一則訊息,開頭聲稱天主教徒「可以在數位革命的背景下,成為新人文主義的先驅」。Pangram 的瀏覽器擴充功能將此貼文標記為人類撰寫。然而,隨後描述人工智慧如何塑造心態和社會結構的三篇貼文,都被擴充功能標記為 AI 生成。「當模擬成為常態時,它會削弱人類的辨別能力,」最後一篇被標記為 AI 的貼文警告道。
教宗利奧十四世(Pope Leo XIV)的其他 X 貼文,包括對烏克蘭和中東持續戰爭的看法,以及呼籲「更公平的財富分配」,也都被 AI 檢測器捕捉到。
「顯然他不是親自經營他的 Twitter 帳號,」Spero 談到教宗時說。「他們有社交媒體人員。但也顯而易見,他們至少使用了某種程度的 AI。」梵蒂岡未回覆對此事的置評請求。
對藍勾勾影響者發布的長篇貼文持懷疑態度的 X 用戶,在得知 Pangram 經常將這些貼文識別為 AI 撰寫時,可能會感到獲得了證實。同樣地,Medium 或 LinkedIn 上也不乏 AI 垃圾內容。甚至隨意瀏覽一下 Substack 上一些最熱門的作者,也會發現大量被標記為 AI 的貼文。
雖然有些作家對使用 AI 嗤之以鼻,但許多作者對使用 AI 輔助工具感到自豪。科技記者 Alex Heath 使用 Claude Cowork 來協助他撰寫發布在 Substack 上的文章。他甚至透過給予特定指令來匹配他的風格和語氣,訓練 Claude 像他一樣寫作。
在某些方面,社交動態的內容只是冰山一角。使用 Pangram 擴充功能的原始功能(允許你反白顯示網路上任何文本進行手動 AI 檢查),你會發現更廣泛的寫作範圍——例如,即將卸任的蘋果執行長 Tim Cook 在 4 月 1 日公司 50 週年之際發布的訊息——也被標記為陽性。(蘋果公司未立即回應置評請求。)
儘管如此,在幾個流行平台上進行持續的即時檢測,有可能改變人們被動吸收螢幕資訊的方式。它不僅會提醒他們注意那些大量產出 AI 生成垃圾的特定帳號,還會不斷提醒他們,在虛擬空間中存在著多少這類東西。這反過來可能會讓讀者變得更具辨別力和懷疑精神——在充滿欺騙性的人造物時代,擁有這些品質絕非壞事。
相關文章
其他收藏 · 0