newsence

RFC 454545 – Human Em Dash Standard

Hacker News·26 天前

這是一個帶有諷刺或實驗性質的 RFC 提案,建議透過特定的破折號使用標準來區分人類寫作與 AI 生成內容,並引發了關於此類標記可行性的討論。

背景

這篇討論源於一份編號為 RFC 454545 的虛擬提案,名為「人類破折號標準」(Human Em Dash Standard)。該提案建議在 Unicode 中引入一個外觀與標準破折號(—)相同、但編碼不同的「人類證明標記」(Human Attestation Mark, HAM),旨在區分人類手寫內容與 AI 生成的文本,解決當前大語言模型(LLM)過度使用破折號所引發的身份識別危機。

社群觀點

Hacker News 的社群對此提案展現了兩極化的反應,許多人一眼便看出這是一篇效仿 RFC 3514(邪惡位元)的愚人節式幽默,但這份幽默背後卻觸動了許多文字創作者的真實痛點。不少留言者感嘆,由於 LLM 極度偏好使用破折號來建構長句或轉折,導致原本喜愛這種標點符號的人類作者,現在常被誤認為是 AI。一位長期在技術文件中使用破折號的用戶提到,他曾被同事質疑是否使用 AI 代寫報告,這種「標點符號被 AI 奪走」的現象,反映出當前社會契約在 AI 介入後的崩潰,人們開始對文字的真實性產生病態的焦慮。

關於破折號與神經多樣性的關聯也引發了熱烈討論。有觀點指出,頻繁使用破折號、括號或條列清單,往往是神經多樣性族群(如 ADHD 或亞斯伯格症)常見的寫作特徵,因為這類作者傾向於在主線思考中插入大量的補充資訊與側向思考。然而,當這些特徵與 AI 的生成模式重疊時,這群人反而最容易被誤判為非人類。社群對此感到憤慨,認為將特定的語法習慣病理化或標籤化為「AI 跡象」是一種退步,甚至有家長分享孩子因為在作文中使用破折號而被老師判定為 85% AI 生成,最終得靠編輯紀錄才得以自清。

在技術實踐層面,多數討論者對該 RFC 的可行性持懷疑態度。反對者認為,這只是一場無止盡的貓捉老鼠遊戲,即便引入了特殊編碼,AI 供應商只需調整 Tokenizer 或在後處理階段加入轉換邏輯,就能輕易規避。更有甚者,若這類「人類標記」真的普及,AI 反而會被訓練去模仿這些標記以偽裝得更像人類。部分用戶則從語言學角度切入,指出破折號的使用本就存在地域差異,例如英國文學更偏好帶空格的連接號(en dash),而非緊湊的破折號。這種風格上的演變與爭論,顯示出試圖透過單一 Unicode 字元來解決信任問題,在現實中顯得過於天真且缺乏實效。

延伸閱讀

在討論串中,有用戶分享了「破折號排行榜」(Em dash leaderboard),列出了在 ChatGPT 發布前最常使用破折號的 HN 用戶,用以證明這種寫作風格在 AI 出現前早已存在。此外,也有人提到 Unicode 官方確實收到過關於 AI 水印的嚴肅提案(L2/25-241),以及 99% Invisible 網站上關於破折號美學的專題討論。針對技術細節,部分開發者提到了 RFC 3514 作為這類諷刺性提案的鼻祖,並討論了零寬度空格(Zero-width space)在隱藏資訊中的潛在應用。

https://gist.github.com/bignimbus/a75cc9d703abf0b21a57c0d21a79e2be