在受限的公共部門環境中實現人工智慧營運化

MIT Technology Review·大約 5 小時前

AI 生成摘要

公共部門面臨獨特的安全性與基礎設施限制，使得大型語言模型難以落地，因此專門構建的小語言模型成為更安全且高效的替代方案。這些專業模型讓政府機構能在保持數據控制與營運連續性的同時，徹底變革搜尋與數據管理能力。

AI 熱潮已席捲各行各業，公共部門組織也面臨著加速採用的壓力。與此同時，政府機構在安全、治理和營運方面面臨著與企業界不同的特殊限制。因此，專為特定用途設計的小型語言模型（SLM）為在這些環境中實現 AI 營運化提供了一條充滿前景的道路。

凱捷（Capgemini）的一項研究發現，全球 79% 的公共部門高管對 AI 的數據安全感到擔憂，考慮到政府數據的高度敏感性及其使用的法律義務，這一數字是可以理解的。正如 Elastic 的 AI 副總裁 Han Xiao 所言：「政府機構對於向網絡發送何種數據必須受到嚴格限制。這在他們思考和管理數據的方式上設定了許多界限。」

對敏感資訊控制的根本需求，是使 AI 部署變得複雜的眾多因素之一，特別是與私營部門的標準營運假設相比時更是如此。

獨特的營運挑戰

當私營部門實體擴展 AI 時，他們通常假設某些條件已經具備，包括與雲端的持續連接、對集中式基礎設施的依賴、對模型透明度不完整的接受，以及對數據流動的限制較少。然而，對於許多國家機構來說，接受這些條件可能是危險的，甚至是不可行的。

政府機構必須確保數據留在其控制之下，資訊可以被查驗和核實，且營運中斷必須降至最低。同時，他們通常必須在互聯網連接受限、不穩定或無法使用的環境中運行系統。這些複雜性阻礙了許多有前景的公共部門 AI 試點項目超越實驗階段。Xiao 表示：「許多人低估了 AI 的營運挑戰。公共部門需要 AI 在各種數據上可靠地運行，並在不崩潰的情況下實現增長。營運的連續性往往被低估了。」一項針對公共部門領導者的 Elastic 調查發現，65% 的人難以在大規模情況下持續實時地使用數據。

基礎設施的限制加劇了這個問題。政府組織在獲取用於訓練和訪問複雜 AI 模型的圖形處理器（GPU）方面也可能面臨困難。正如 Xiao 指出的：「與私營部門不同，政府並不常採購 GPU，他們不習慣管理 GPU 基礎設施。因此，獲取 GPU 來運行模型是許多公共部門的瓶頸。」

更小、更實用的模型

公共部門眾多不可妥協的要求使得大型語言模型（LLM）難以維繫。但 SLM 可以部署在本地，提供更高的安全性和控制力。SLM 是專門化的 AI 模型，通常使用數十億而非數千億個參數，這使得它們對計算資源的需求遠低於最大的 LLM。

公共部門不需要構建託管在異地集中式場所的超大型模型。一項經驗性研究發現，SLM 的表現與 LLM 相當甚至更好。SLM 允許有效且高效地使用敏感資訊，同時避免了維護大型模型的營運複雜性。Xiao 這樣描述：** **「使用 ChatGPT 進行校對很容易。但在沒有網絡連接的環境中，要讓自己的大型語言模型同樣順暢地運行是非常困難的。」

SLM 是根據使用部門或機構的需求量身定制的。數據安全地存儲在模型之外，僅在查詢時才被訪問。精心設計的提示詞（prompts）確保僅檢索最相關的資訊，從而提供更準確的回答。通過使用智能檢索、向量搜索和可驗證來源接地等方法，可以構建滿足公共部門需求的 AI 系統。

因此，公共部門採用 AI 的下一個階段可能是將 AI 工具帶到數據所在地，而不是將數據發送到雲端。Gartner 預測，到 2027 年，小型、特定任務的 AI 模型的使用量將是 LLM 的三倍。

卓越的搜索能力

「當公共部門的人聽到 AI 時，他們可能會想到 ChatGPT。但我們可以更有野心，」Xiao 說。「AI 可以徹底改變政府搜索和管理其海量數據的方式。」

超越聊天機器人，可以看到 AI 最直接的機會之一：大幅改進的搜索。與許多組織一樣，公共部門擁有堆積如山的非結構化數據——包括技術報告、採購文件、會議記錄和發票。然而，今天的 AI 可以提供來自混合媒體的結果，如可讀的 PDF、掃描件、圖像、電子表格和錄音，並且支持多種語言。所有這些都可以通過 SLM 驅動的系統進行索引，以提供定制化的回答並以任何語言起草複雜文本，同時確保輸出符合法律規範。Xiao 說：「公共部門有很多數據，但他們並不總是知道如何使用這些數據。他們不知道可能性在哪裡。」

更強大的是，AI 可以幫助政府員工解讀他們訪問的數據。Xiao 說：「今天的 AI 可以為你提供如何利用這些數據的全新視角。」經過良好訓練的 SLM 可以解讀法律規範、從公眾諮詢中提取見解、支持數據驅動的行政決策，並改善公眾獲取服務和行政資訊的渠道。這有助於大幅改善公共部門的營運方式。

小型語言模型的承諾

關注 SLM 將對話重點從模型的全面性轉向了效率。LLM 會產生顯著的性能和計算成本，並需要許多公共實體負擔不起的專門硬件。儘管需要一些資本支出，但 SLM 比 LLM 更節省資源，因此往往更便宜並能減少對環境的影響。

公共部門機構通常面臨嚴格的審計要求，而 SLM 算法可以被記錄並認證為透明。一些國家（特別是歐洲）還有如 GDPR 等隱私法規，SLM 在設計上可以滿足這些要求。

量身定制的訓練數據能產生更有針對性的結果，減少 AI 容易出現的錯誤、偏見和幻覺。正如 Xiao 所言：** **「大型語言模型根據其訓練內容生成文本，因此它們的訓練有一個截止日期。如果你詢問在那之後的任何事情，它就會產生幻覺。我們可以通過強制模型基於經過驗證的來源工作來解決這個問題。」

通過將數據保留在本地服務器甚至特定設備上，風險也能降至最低。這不是為了孤立，而是為了實現信任、韌性和相關性的戰略自主。

通過優先考慮為本地處理數據的環境而設計的特定任務模型，並持續監測性能和影響，公共部門組織可以建立持久的 AI 能力來支持現實世界的決策。Xiao 建議道：「不要從聊天機器人開始；從搜索開始。我們認為的 AI 智能，很大程度上其實是關於找到正確的資訊。」

本內容由 MIT Technology Review 的定制內容部門 Insights 製作。並非由 MIT Technology Review 的編輯團隊撰寫。本內容由人類作者、編輯、分析師和插畫師進行研究、設計和撰寫，包括調查問卷的編寫和數據收集。可能使用的 AI 工具僅限於通過嚴格人工審核的輔助製作流程。

— MIT Technology Review

其他收藏 · 0

收藏夾

你的個人知識庫

在受限的公共部門環境中實現人工智慧營運化