Opus 4.7 識破了真實的凱西：網路匿名時代的終結

Hacker News·1 天前

我發現最新的 AI 模型 Claude Opus 4.7 僅憑 150 字的未發表文字就能準確辨認出我的身份，這預示著在風格指紋無所遁形的未來，網路匿名將幾乎不可能存在。

背景

本文探討了人工智慧在身分識別能力上的重大突破，作者 Kelsey Piper 發現 Anthropic 最新發布的 Claude Opus 4.7 模型，僅憑不到 150 字的未公開草稿，就能精準辨識出她的真實身分。即便作者切換至無痕模式、停用記憶功能，甚至測試與其平時寫作風格完全不同的題材，該模型依然能從字裡行間的細微特徵鎖定作者，這引發了關於網路匿名性是否已走向終結的深刻憂慮。

社群觀點

Hacker News 的討論聚焦於這種「超強風格學」辨識能力的技術成因與社會影響。部分評論者認為，這並非單純的技術躍進，而可能是訓練資料污染的結果。有觀點指出，作者過去曾多次對不同模型進行類似測試，這些測試過程中的輸入數據可能已被納入後續模型的訓練集，並與作者身分產生關聯。然而，也有資深開發者分享了早期測試 GPT-4 原始版本的經驗，證實大型語言模型在未經指令微調前，就展現出能根據片段文字模仿特定人物語氣並自動署名的能力，這顯示風格辨識可能是模型規模化後的內生屬性。

針對隱私保護的未來，社群內部分為樂觀與悲觀兩派。悲觀者認為，只要一個人在網路上留下的文字量足夠大，其獨特的表達習慣就如同數位指紋，未來任何匿名發言都可能被追溯至真實身分。即便刻意改變語氣，也可能因破壞了溝通的自然性而失去交流價值。相對而言，有討論者提出「防禦性對抗」的可能性，建議開發本地端模型或瀏覽器擴充功能，在發布文字前先進行風格混淆，以對抗這種自動化的身分識別。

有趣的是，討論中也出現了對「後真相時代」的另類解讀。有留言指出，當 AI 強大到能輕易辨識身分時，它同樣具備強大的偽造能力。未來社會可能會演變成「沒人相信任何事」的狀態，因為任何看似真實的風格都可能是 AI 模擬出來的。此外，關於 AI 辨識過程的黑箱問題也受到關注，雖然 Opus 4.7 能夠給出答案，但其事後解釋往往被認為是胡言亂語或缺乏邏輯的後驗證，且新版本隱藏了思維鏈過程，使得外界更難理解模型究竟是捕捉到了哪些語法特徵或邏輯規律。

最後，部分社群成員反思了匿名性消失對社會結構的衝擊。有人提出一個極端的假設：如果未來沒有人能保有秘密，所有行為都將攤在陽光下，這種透明性或許能遏止惡意行為，但也可能導致社會規範的極度僵化。目前看來，這種「自動化去匿名化」的趨勢似乎不可逆轉，而人類社會尚未對一個失去文字隱私的世界做好心理準備。

延伸閱讀

在討論串中，有使用者提到多年前 Hacker News 曾出現過一款基於風格學的工具，使用者輸入帳號後，該工具能找出寫作風格最相似的其他用戶。此外，亦有留言提及 TrueCrypt 專案在多年前關閉的時機，恰好與學術界發表關於代碼風格學辨識的研究論文時間點相近，暗示風格辨識技術在資安領域早已是受關注的課題。

— Hacker News

其他收藏 · 0

你的個人知識庫

Opus 4.7 識破了真實的凱西：網路匿名時代的終結

背景

社群觀點

延伸閱讀