RFC 454545 – Human Em Dash Standard
這是一個帶有諷刺或實驗性質的 RFC 提案,建議透過特定的破折號使用標準來區分人類寫作與 AI 生成內容,並引發了關於此類標記可行性的討論。
背景
這篇討論源於一份編號為 RFC 454545 的虛擬提案,名為「人類破折號標準」(Human Em Dash Standard)。該提案建議在 Unicode 中引入一個外觀與標準破折號(—)相同、但編碼不同的「人類證明標記」(Human Attestation Mark, HAM),旨在區分人類手寫內容與 AI 生成的文本,解決當前大語言模型(LLM)過度使用破折號所引發的身份識別危機。
社群觀點
Hacker News 的社群對此提案展現了兩極化的反應,許多人一眼便看出這是一篇效仿 RFC 3514(邪惡位元)的愚人節式幽默,但這份幽默背後卻觸動了許多文字創作者的真實痛點。不少留言者感嘆,由於 LLM 極度偏好使用破折號來建構長句或轉折,導致原本喜愛這種標點符號的人類作者,現在常被誤認為是 AI。一位長期在技術文件中使用破折號的用戶提到,他曾被同事質疑是否使用 AI 代寫報告,這種「標點符號被 AI 奪走」的現象,反映出當前社會契約在 AI 介入後的崩潰,人們開始對文字的真實性產生病態的焦慮。
關於破折號與神經多樣性的關聯也引發了熱烈討論。有觀點指出,頻繁使用破折號、括號或條列清單,往往是神經多樣性族群(如 ADHD 或亞斯伯格症)常見的寫作特徵,因為這類作者傾向於在主線思考中插入大量的補充資訊與側向思考。然而,當這些特徵與 AI 的生成模式重疊時,這群人反而最容易被誤判為非人類。社群對此感到憤慨,認為將特定的語法習慣病理化或標籤化為「AI 跡象」是一種退步,甚至有家長分享孩子因為在作文中使用破折號而被老師判定為 85% AI 生成,最終得靠編輯紀錄才得以自清。
在技術實踐層面,多數討論者對該 RFC 的可行性持懷疑態度。反對者認為,這只是一場無止盡的貓捉老鼠遊戲,即便引入了特殊編碼,AI 供應商只需調整 Tokenizer 或在後處理階段加入轉換邏輯,就能輕易規避。更有甚者,若這類「人類標記」真的普及,AI 反而會被訓練去模仿這些標記以偽裝得更像人類。部分用戶則從語言學角度切入,指出破折號的使用本就存在地域差異,例如英國文學更偏好帶空格的連接號(en dash),而非緊湊的破折號。這種風格上的演變與爭論,顯示出試圖透過單一 Unicode 字元來解決信任問題,在現實中顯得過於天真且缺乏實效。
延伸閱讀
在討論串中,有用戶分享了「破折號排行榜」(Em dash leaderboard),列出了在 ChatGPT 發布前最常使用破折號的 HN 用戶,用以證明這種寫作風格在 AI 出現前早已存在。此外,也有人提到 Unicode 官方確實收到過關於 AI 水印的嚴肅提案(L2/25-241),以及 99% Invisible 網站上關於破折號美學的專題討論。針對技術細節,部分開發者提到了 RFC 3514 作為這類諷刺性提案的鼻祖,並討論了零寬度空格(Zero-width space)在隱藏資訊中的潛在應用。