Promptions 透過動態 UI 控制項讓 AI 提示詞更加精準
Promptions 幫助開發者在聊天介面中加入動態且具備上下文感知能力的控制項,讓使用者無需撰寫冗長的指令即可快速引導生成式 AI 的回應結果。
任何使用 AI 系統的人都體會過這種挫折感:輸入提示詞後,回應卻不符合預期,接著陷入不斷重複的循環。這種試錯過程既難以預測又令人沮喪。為了瞭解決這個問題,我們很高興推出 Promptions(prompt + options),這是一個 UI 框架,旨在幫助開發者構建具有更精確用戶控制功能的 AI 介面。
其簡潔的設計使其易於整合到任何依賴附加情境的場景中,包括客戶服務、教育和醫療。Promptions 已在 Microsoft Foundry Labs (在新分頁中開啟) 和 GitHub 上以 MIT 授權協議發佈。
背景
Promptions 基於我們的研究項目:「動態提示詞中間層:用於理解任務的情境化提示詞優化控制」。該項目探討了知識工作者在目標是「理解」而非「創作」時如何使用生成式 AI。雖然大眾討論多集中在 AI 生成文本或圖像,但理解過程涉及要求 AI 解釋、澄清或教學——這類任務可能迅速變得複雜。以試算表公式為例:一位用戶可能想要簡單的語法拆解,另一位可能需要除錯指南,而第三位則可能需要適合教導同事的解釋。同一個公式根據用戶的角色、專業知識和目標,可能需要完全不同的解釋。
在這些看似簡單的請求背後隱藏著巨大的複雜性。用戶經常發現他們提問的方式與 AI 所需的詳細程度不匹配。為了澄清他們真正的需求,往往需要撰寫冗長且措辭謹慎的提示詞,這讓人感到疲憊。此外,由於自然語言與系統行為之間的聯繫並不總是透明的,因此很難預測 AI 將如何解讀特定的請求。最終,用戶花在管理互動本身的時間,比理解他們希望學習的材料還要多。
確定用戶希望如何引導 AI 輸出
為了探索這些挑戰為何持續存在,以及人們如何更好地引導 AI 獲得客製化結果,我們對跨技術與非技術職位的知識工作者進行了兩項研究。他們的經驗凸顯了引導 Promptions 設計的重要差距。
我們的第一項研究涉及 38 位來自工程、研究、行銷和專案管理領域的專業人士。參與者審閱了提供靜態提示詞優化選項(如「長度」、「語氣」或「開頭方式」)的設計原型,用於調整 AI 的回應。
儘管這些靜態選項有所幫助,但它們無法根據參與者試圖理解的特定公式、程式碼片段或文本進行調整。參與者還希望有更直接的方式來客製化回應的語氣、細節或格式,而無需手動輸入指令。
為什麼動態優化很重要
第二項研究在受控實驗中測試了原型。我們將第一項研究中的靜態設計(稱為「靜態提示詞優化控制」,Static PRC)與具有回應參與者回饋功能的「動態提示詞優化控制」(Dynamic PRC)進行了比較。16 位熟悉生成式 AI 的技術專業人士完成了六項任務,涵蓋程式碼解釋、理解複雜主題和學習新技能。每位參與者都測試了這兩種系統,任務分配經過平衡以確保公平比較。
比較 Dynamic PRC 與 Static PRC 揭示了關於動態提示詞優化選項如何改變用戶的控制感、探索慾,以及這些選項如何幫助他們反思自身理解的關鍵見解。
靜態提示詞優化
Static PRC 提供了一組在初步研究中確定的預選控制項(圖 1)。我們預期這些選項在多種類型的解釋尋求提示詞中都會很有用。
圖 1:Static PRC 介面
動態提示詞優化
我們構建了 Dynamic PRC 系統,根據用戶的輸入自動產生提示詞選項和優化建議,並即時呈現,以便用戶調整這些控制項並更精確地引導 AI 的回應(圖 2)。
圖 2:Dynamic PRC 系統中的互動流程。(1) 用戶要求系統解釋一個長 Excel 公式。(2) Dynamic PRC 生成優化選項:解釋詳細程度、重點領域和學習目標。(3) 用戶修改這些選項。(4) AI 根據所選選項回傳解釋。(5) 在對話面板中,用戶添加了控制回應結構或格式的請求。(6) Dynamic PRC 根據此輸入生成新的選項集。(7) AI 產生反映新應用選項的更新解釋。
亮點:AI 驅動體驗
Microsoft Research Copilot 體驗
透過我們的 AI 驅動體驗,探索更多關於 Microsoft 研究的內容
研究結果
參與者一致表示,動態控制項讓他們更容易表達任務的細微差別,而無需反覆修改提示詞的措辭。這減少了提示詞工程(prompt engineering)的工作量,讓用戶能更專注於理解內容,而非管理措辭技巧。
圖 3:用戶對 Static PRC 與 Dynamic PRC 在關鍵評估標準上的偏好比較。
情境化選項促使用戶嘗試他們可能不會主動想到的優化方式。這種行為表明,Dynamic PRC 可以拓寬用戶參與 AI 解釋的方式,幫助他們發現超出初始意圖的處理任務的新方法。除了探索之外,動態控制還促使參與者更深思熟慮地思考他們的目標。諸如「學習目標」和「回應格式」之類的選項幫助他們釐清需求,無論是應用概念的指導還是逐步的疑難排解幫助。
圖 4:參與者對 Static PRC 和 Dynamic PRC 有效性的評分比較。
雖然參與者看重 Dynamic PRC 的適應性,但也發現它較難解讀。有些人難以預測所選選項將如何影響回應,並指出這些控制項顯得不透明,因為效果只有在輸出出現後才會變得清晰。
然而,對 Dynamic PRC 整體的正面反應讓我們看到 Promptions 具有廣泛的實用性,促使我們將其分享給開發者社群。
技術設計
Promptions 作為一個輕量級的中間層,位於用戶與底層語言模型之間(圖 5)。它包含兩個主要組件:
選項模組 (Option Module):此模組審閱用戶的提示詞和對話歷史,然後生成一組優化選項。這些選項以互動式 UI 元素(單選按鈕、核取方塊、文字欄位)的形式呈現,直接影響 AI 對提示詞的解讀方式。
對話模組 (Chat Module):此模組根據優化後的提示詞產生 AI 的回應。當用戶更改選項時,回應會立即更新,使互動感覺更像是不斷演進的對話,而非重複提示的循環。
圖 5:Promptions 中間層工作流程。(1) 選項模組讀取用戶的提示詞和對話歷史,並 (2) 生成提示詞選項。(3) 這些選項由專用組件在行內渲染。(4) 對話模組將這些優化後的選項與原始提示詞和歷史記錄結合,以產生回應。(5) 當用戶調整控制項時,優化內容會更新,對話模組也會隨之重新生成回應。
將 Promptions 加入應用程式
Promptions 可以輕鬆整合到任何對話式聊天介面中。開發者只需添加一個組件來顯示選項,並將其連接到 AI 系統。無需在會話之間儲存數據,這保持了實作的簡潔性。Microsoft Foundry Labs (在新分頁中開啟) 儲存庫包含兩個範例應用程式:一個通用聊天機器人和一個圖像生成器,展示了這種設計在實踐中的應用。
Promptions 非常適合用戶需要提供情境但不想全部寫出來的介面。用戶無需輸入冗長的解釋,只需調整引導 AI 回應的控制項,即可符合其偏好。
進一步探索的問題
Promptions 為未來的研究提出了重要問題。關鍵的易用性挑戰包括釐清動態選項如何影響 AI 輸出,以及管理多個控制項的複雜性。其他問題涉及如何在即時調整與持久設定之間取得平衡,以及如何讓用戶協作分享選項。
在技術方面,問題集中在如何生成更有效的選項、驗證和客製化動態介面、自動收集相關情境,以及支持跨會話儲存和分享選項集。
這些問題,連同對協作、倫理、安全和擴展性的更廣泛考量,正引導著我們在 Promptions 及相關系統上的持續工作。
工具
在 Microsoft Foundry Labs 探索 Promptions
透過將 Promptions 開源,我們希望幫助開發者創造更聰明、更具響應性的 AI 體驗。
在 Microsoft Foundry Labs 探索 Promptions (在新分頁中開啟)
這篇文章 Promptions 透過動態 UI 控制項讓 AI 提示更精確 最初發表於 Microsoft Research。
相關文章