
更新模型規範以增強青少年保護
OpenAI 正透過「U18 原則」更新其模型規範,旨在確保 ChatGPT 為 13 至 17 歲用戶提供安全且適合年齡的體驗,此更新汲取了專家指導和發展科學的見解。
我們正在分享對「模型規範」(Model Spec)的更新。模型規範是一套書面規則、價值觀和行為期望,用以指導我們的 AI 模型應如何表現,尤其是在困難或高風險的情況下。本次更新與 18 歲以下(U18)原則(opens in a new window) 相關。模型行為對於人們與 AI 的互動至關重要,而青少年與成人的發展需求不同。
U18 原則指導 ChatGPT 如何為 13 至 17 歲的青少年提供安全且適合其年齡的體驗。此方法以發展科學為基礎,優先考慮預防、透明度和早期干預。在制定這些原則的過程中,我們曾與包括美國心理學會(American Psychological Association)在內的外部專家進行預覽,作為我們持續尋求意見以加強方法的一部分。
雖然模型規範的原則繼續適用於成人和青少年用戶,但本次更新闡明了如何在青少年情境中應用這些原則,特別是當未成年人的安全考量可能更為顯著時。
U18 原則基於四項指導承諾:
- 將青少年安全放在首位,即使這可能與其他目標產生衝突
- 透過鼓勵線下人際關係和信任的資源,促進現實世界的支持
- 像對待青少年一樣對待他們,既不居高臨下,也不將他們視為成人
- 透過設定清晰的期望來保持透明
與我們的 青少年安全藍圖 一致,這些原則指導了我們迄今為止的青少年安全工作,包括我們對在註冊時告知自己未滿 18 歲的用戶實施的內容保護,以及透過家長控制。在這些情境中,我們實施了安全措施,以指導模型在討論高風險領域時格外小心,包括自殺與自殘、浪漫或性化角色扮演、露骨或色情內容、危險活動和物質、身體形象和飲食失調,以及要求保守不安全行為秘密的請求。
美國心理學會(American Psychological Association)審查了 U18 模型規範的早期草稿,並提供了重要的長期見解,他們明確表示了保護青少年的重要性:
「美國心理學會鼓勵 AI 開發者為其產品的年輕用戶提供適合其發展階段的預防措施,並對年輕用戶採取更具保護性的方法。兒童和青少年如果能平衡 AI 工具的使用與科學證明對社交、心理、行為甚至生理發展至關重要的人際互動,將會受益。青少年與 AI 的互動應受到嚴格監督,並與值得信賴的成人討論,以鼓勵批判性地審查 AI 機器人提供的內容,並鼓勵年輕人發展獨立思考和技能。」—Dr. Arthur C. Evans Jr, 美國心理學會執行長
本次更新還闡明了在出現青少年安全疑慮時,助理應如何回應。這意味著當對話進入高風險領域時,青少年應該遇到更強的防護欄、更安全的替代方案,以及尋求值得信賴的線下支持的鼓勵。在有迫切風險的情況下,鼓勵青少年聯繫緊急服務或危機資源。
與模型規範的其餘部分一樣,U18 原則反映了我們預期的模型行為。隨著我們納入新的研究、專家意見和實際使用情況,我們將繼續對其進行完善。
在加強青少年安全工作上精益求精
除了更新模型規範,我們還採取了多層次的方法來加強 ChatGPT 的青少年安全,涵蓋產品安全措施、家庭支持和專家指導。
自推出家長控制(opens in a new window) 以來,我們已將保護措施擴展到新的產品,包括群組聊天、ChatGPT Atlas 瀏覽器和 Sora 應用程式。這些更新有助於家長在我們推出新產品和功能時,為其青少年的 ChatGPT 體驗進行客製化。
與專家合作
我們的青少年安全工作由跨學科和專業領域專家的緊密合作指導。今年十月,我們成立了福祉與 AI 專家委員會,以協助指導和定義適合所有年齡層的健康 AI 互動。這項工作為家長控制和家長通知提供了指導。我們還透過我們的全球醫師網絡 納入臨床專業知識,以指導安全研究並評估模型行為,包括改進 ChatGPT 如何識別困擾並在適當時引導人們尋求專業護理。我們以 GPT‑5.2 為基礎,並透過與 ThroughLine(opens in a new window) 的合作,在 ChatGPT 和 Sora 中顯示本地化的求助熱線,擴大了對現實世界支持的獲取。
後續計畫
我們正在為 ChatGPT 消費者方案推出年齡預測模型(opens in a new window) 的早期階段。這將有助於我們在認為帳戶屬於未成年人時,自動應用青少年安全措施。如果我們對某人的年齡沒有把握或資訊不完整,我們將預設為 U18 體驗,並為成人提供驗證年齡的方式。
加強青少年安全是一項持續性的工作,我們將繼續改進化長控制和模型功能,擴大家長資源,與組織、研究人員和專家合作夥伴(包括福祉委員會和全球醫師網絡)合作。
我們致力於建立強大的青少年保護措施,並隨著時間的推移不斷改進,以更好地支持青少年和家庭。
— OpenAI
相關文章