
在受限的公共部門環境中實現人工智慧營運化
AI 生成摘要
公共部門面臨獨特的安全性與基礎設施限制,使得大型語言模型難以落地,因此專門構建的小語言模型成為更安全且高效的替代方案。這些專業模型讓政府機構能在保持數據控制與營運連續性的同時,徹底變革搜尋與數據管理能力。
AI 熱潮已席捲各行各業,公共部門組織也面臨著加速採用的壓力。與此同時,政府機構在安全、治理和營運方面面臨著與企業界不同的特殊限制。因此,專為特定用途設計的小型語言模型(SLM)為在這些環境中實現 AI 營運化提供了一條充滿前景的道路。
凱捷(Capgemini)的一項研究發現,全球 79% 的公共部門高管對 AI 的數據安全感到擔憂,考慮到政府數據的高度敏感性及其使用的法律義務,這一數字是可以理解的。正如 Elastic 的 AI 副總裁 Han Xiao 所言:「政府機構對於向網絡發送何種數據必須受到嚴格限制。這在他們思考和管理數據的方式上設定了許多界限。」
對敏感資訊控制的根本需求,是使 AI 部署變得複雜的眾多因素之一,特別是與私營部門的標準營運假設相比時更是如此。
獨特的營運挑戰
當私營部門實體擴展 AI 時,他們通常假設某些條件已經具備,包括與雲端的持續連接、對集中式基礎設施的依賴、對模型透明度不完整的接受,以及對數據流動的限制較少。然而,對於許多國家機構來說,接受這些條件可能是危險的,甚至是不可行的。
政府機構必須確保數據留在其控制之下,資訊可以被查驗和核實,且營運中斷必須降至最低。同時,他們通常必須在互聯網連接受限、不穩定或無法使用的環境中運行系統。這些複雜性阻礙了許多有前景的公共部門 AI 試點項目超越實驗階段。Xiao 表示:「許多人低估了 AI 的營運挑戰。公共部門需要 AI 在各種數據上可靠地運行,並在不崩潰的情況下實現增長。營運的連續性往往被低估了。」一項針對公共部門領導者的 Elastic 調查發現,65% 的人難以在大規模情況下持續實時地使用數據。
基礎設施的限制加劇了這個問題。政府組織在獲取用於訓練和訪問複雜 AI 模型的圖形處理器(GPU)方面也可能面臨困難。正如 Xiao 指出的:「與私營部門不同,政府並不常採購 GPU,他們不習慣管理 GPU 基礎設施。因此,獲取 GPU 來運行模型是許多公共部門的瓶頸。」
更小、更實用的模型
公共部門眾多不可妥協的要求使得大型語言模型(LLM)難以維繫。但 SLM 可以部署在本地,提供更高的安全性和控制力。SLM 是專門化的 AI 模型,通常使用數十億而非數千億個參數,這使得它們對計算資源的需求遠低於最大的 LLM。
公共部門不需要構建託管在異地集中式場所的超大型模型。一項經驗性研究發現,SLM 的表現與 LLM 相當甚至更好。SLM 允許有效且高效地使用敏感資訊,同時避免了維護大型模型的營運複雜性。Xiao 這樣描述:** **「使用 ChatGPT 進行校對很容易。但在沒有網絡連接的環境中,要讓自己的大型語言模型同樣順暢地運行是非常困難的。」
SLM 是根據使用部門或機構的需求量身定制的。數據安全地存儲在模型之外,僅在查詢時才被訪問。精心設計的提示詞(prompts)確保僅檢索最相關的資訊,從而提供更準確的回答。通過使用智能檢索、向量搜索和可驗證來源接地等方法,可以構建滿足公共部門需求的 AI 系統。
因此,公共部門採用 AI 的下一個階段可能是將 AI 工具帶到數據所在地,而不是將數據發送到雲端。Gartner 預測,到 2027 年,小型、特定任務的 AI 模型的使用量將是 LLM 的三倍。
卓越的搜索能力
「當公共部門的人聽到 AI 時,他們可能會想到 ChatGPT。但我們可以更有野心,」Xiao 說。「AI 可以徹底改變政府搜索和管理其海量數據的方式。」
超越聊天機器人,可以看到 AI 最直接的機會之一:大幅改進的搜索。與許多組織一樣,公共部門擁有堆積如山的非結構化數據——包括技術報告、採購文件、會議記錄和發票。然而,今天的 AI 可以提供來自混合媒體的結果,如可讀的 PDF、掃描件、圖像、電子表格和錄音,並且支持多種語言。所有這些都可以通過 SLM 驅動的系統進行索引,以提供定制化的回答並以任何語言起草複雜文本,同時確保輸出符合法律規範。Xiao 說:「公共部門有很多數據,但他們並不總是知道如何使用這些數據。他們不知道可能性在哪裡。」
更強大的是,AI 可以幫助政府員工解讀他們訪問的數據。Xiao 說:「今天的 AI 可以為你提供如何利用這些數據的全新視角。」經過良好訓練的 SLM 可以解讀法律規範、從公眾諮詢中提取見解、支持數據驅動的行政決策,並改善公眾獲取服務和行政資訊的渠道。這有助於大幅改善公共部門的營運方式。
小型語言模型的承諾
關注 SLM 將對話重點從模型的全面性轉向了效率。LLM 會產生顯著的性能和計算成本,並需要許多公共實體負擔不起的專門硬件。儘管需要一些資本支出,但 SLM 比 LLM 更節省資源,因此往往更便宜並能減少對環境的影響。
公共部門機構通常面臨嚴格的審計要求,而 SLM 算法可以被記錄並認證為透明。一些國家(特別是歐洲)還有如 GDPR 等隱私法規,SLM 在設計上可以滿足這些要求。
量身定制的訓練數據能產生更有針對性的結果,減少 AI 容易出現的錯誤、偏見和幻覺。正如 Xiao 所言:** **「大型語言模型根據其訓練內容生成文本,因此它們的訓練有一個截止日期。如果你詢問在那之後的任何事情,它就會產生幻覺。我們可以通過強制模型基於經過驗證的來源工作來解決這個問題。」
通過將數據保留在本地服務器甚至特定設備上,風險也能降至最低。這不是為了孤立,而是為了實現信任、韌性和相關性的戰略自主。
通過優先考慮為本地處理數據的環境而設計的特定任務模型,並持續監測性能和影響,公共部門組織可以建立持久的 AI 能力來支持現實世界的決策。Xiao 建議道:「不要從聊天機器人開始;從搜索開始。我們認為的 AI 智能,很大程度上其實是關於找到正確的資訊。」
本內容由 MIT Technology Review 的定制內容部門 Insights 製作。並非由 MIT Technology Review 的編輯團隊撰寫。本內容由人類作者、編輯、分析師和插畫師進行研究、設計和撰寫,包括調查問卷的編寫和數據收集。可能使用的 AI 工具僅限於通過嚴格人工審核的輔助製作流程。
相關文章
其他收藏 · 0
收藏夾