Promptions 透過動態 UI 控制項讓 AI 提示詞更加精準

Microsoft Research·4 個月前

Promptions 幫助開發者在聊天介面中加入動態且具備上下文感知能力的控制項，讓使用者無需撰寫冗長的指令即可快速引導生成式 AI 的回應結果。

任何使用 AI 系統的人都體會過這種挫折感：輸入提示詞後，回應卻不符合預期，接著陷入不斷重複的循環。這種試錯過程既難以預測又令人沮喪。為了瞭解決這個問題，我們很高興推出 Promptions（prompt + options），這是一個 UI 框架，旨在幫助開發者構建具有更精確用戶控制功能的 AI 介面。

其簡潔的設計使其易於整合到任何依賴附加情境的場景中，包括客戶服務、教育和醫療。Promptions 已在 Microsoft Foundry Labs (在新分頁中開啟) 和 GitHub 上以 MIT 授權協議發佈。

背景

Promptions 基於我們的研究項目：「動態提示詞中間層：用於理解任務的情境化提示詞優化控制」。該項目探討了知識工作者在目標是「理解」而非「創作」時如何使用生成式 AI。雖然大眾討論多集中在 AI 生成文本或圖像，但理解過程涉及要求 AI 解釋、澄清或教學——這類任務可能迅速變得複雜。以試算表公式為例：一位用戶可能想要簡單的語法拆解，另一位可能需要除錯指南，而第三位則可能需要適合教導同事的解釋。同一個公式根據用戶的角色、專業知識和目標，可能需要完全不同的解釋。

在這些看似簡單的請求背後隱藏著巨大的複雜性。用戶經常發現他們提問的方式與 AI 所需的詳細程度不匹配。為了澄清他們真正的需求，往往需要撰寫冗長且措辭謹慎的提示詞，這讓人感到疲憊。此外，由於自然語言與系統行為之間的聯繫並不總是透明的，因此很難預測 AI 將如何解讀特定的請求。最終，用戶花在管理互動本身的時間，比理解他們希望學習的材料還要多。

確定用戶希望如何引導 AI 輸出

為了探索這些挑戰為何持續存在，以及人們如何更好地引導 AI 獲得客製化結果，我們對跨技術與非技術職位的知識工作者進行了兩項研究。他們的經驗凸顯了引導 Promptions 設計的重要差距。

我們的第一項研究涉及 38 位來自工程、研究、行銷和專案管理領域的專業人士。參與者審閱了提供靜態提示詞優化選項（如「長度」、「語氣」或「開頭方式」）的設計原型，用於調整 AI 的回應。

儘管這些靜態選項有所幫助，但它們無法根據參與者試圖理解的特定公式、程式碼片段或文本進行調整。參與者還希望有更直接的方式來客製化回應的語氣、細節或格式，而無需手動輸入指令。

為什麼動態優化很重要

第二項研究在受控實驗中測試了原型。我們將第一項研究中的靜態設計（稱為「靜態提示詞優化控制」，Static PRC）與具有回應參與者回饋功能的「動態提示詞優化控制」（Dynamic PRC）進行了比較。16 位熟悉生成式 AI 的技術專業人士完成了六項任務，涵蓋程式碼解釋、理解複雜主題和學習新技能。每位參與者都測試了這兩種系統，任務分配經過平衡以確保公平比較。

比較 Dynamic PRC 與 Static PRC 揭示了關於動態提示詞優化選項如何改變用戶的控制感、探索慾，以及這些選項如何幫助他們反思自身理解的關鍵見解。

靜態提示詞優化

Static PRC 提供了一組在初步研究中確定的預選控制項（圖 1）。我們預期這些選項在多種類型的解釋尋求提示詞中都會很有用。

圖 1：Static PRC 介面

動態提示詞優化

我們構建了 Dynamic PRC 系統，根據用戶的輸入自動產生提示詞選項和優化建議，並即時呈現，以便用戶調整這些控制項並更精確地引導 AI 的回應（圖 2）。

圖 2：Dynamic PRC 系統中的互動流程。(1) 用戶要求系統解釋一個長 Excel 公式。(2) Dynamic PRC 生成優化選項：解釋詳細程度、重點領域和學習目標。(3) 用戶修改這些選項。(4) AI 根據所選選項回傳解釋。(5) 在對話面板中，用戶添加了控制回應結構或格式的請求。(6) Dynamic PRC 根據此輸入生成新的選項集。(7) AI 產生反映新應用選項的更新解釋。

亮點：AI 驅動體驗

Microsoft Research Copilot 體驗

透過我們的 AI 驅動體驗，探索更多關於 Microsoft 研究的內容

立即開始

研究結果

參與者一致表示，動態控制項讓他們更容易表達任務的細微差別，而無需反覆修改提示詞的措辭。這減少了提示詞工程（prompt engineering）的工作量，讓用戶能更專注於理解內容，而非管理措辭技巧。

圖 3：用戶對 Static PRC 與 Dynamic PRC 在關鍵評估標準上的偏好比較。

情境化選項促使用戶嘗試他們可能不會主動想到的優化方式。這種行為表明，Dynamic PRC 可以拓寬用戶參與 AI 解釋的方式，幫助他們發現超出初始意圖的處理任務的新方法。除了探索之外，動態控制還促使參與者更深思熟慮地思考他們的目標。諸如「學習目標」和「回應格式」之類的選項幫助他們釐清需求，無論是應用概念的指導還是逐步的疑難排解幫助。

圖 4：參與者對 Static PRC 和 Dynamic PRC 有效性的評分比較。

雖然參與者看重 Dynamic PRC 的適應性，但也發現它較難解讀。有些人難以預測所選選項將如何影響回應，並指出這些控制項顯得不透明，因為效果只有在輸出出現後才會變得清晰。

然而，對 Dynamic PRC 整體的正面反應讓我們看到 Promptions 具有廣泛的實用性，促使我們將其分享給開發者社群。

技術設計

Promptions 作為一個輕量級的中間層，位於用戶與底層語言模型之間（圖 5）。它包含兩個主要組件：

選項模組 (Option Module)：此模組審閱用戶的提示詞和對話歷史，然後生成一組優化選項。這些選項以互動式 UI 元素（單選按鈕、核取方塊、文字欄位）的形式呈現，直接影響 AI 對提示詞的解讀方式。

對話模組 (Chat Module)：此模組根據優化後的提示詞產生 AI 的回應。當用戶更改選項時，回應會立即更新，使互動感覺更像是不斷演進的對話，而非重複提示的循環。

圖 5：Promptions 中間層工作流程。(1) 選項模組讀取用戶的提示詞和對話歷史，並 (2) 生成提示詞選項。(3) 這些選項由專用組件在行內渲染。(4) 對話模組將這些優化後的選項與原始提示詞和歷史記錄結合，以產生回應。(5) 當用戶調整控制項時，優化內容會更新，對話模組也會隨之重新生成回應。

將 Promptions 加入應用程式

Promptions 可以輕鬆整合到任何對話式聊天介面中。開發者只需添加一個組件來顯示選項，並將其連接到 AI 系統。無需在會話之間儲存數據，這保持了實作的簡潔性。Microsoft Foundry Labs (在新分頁中開啟) 儲存庫包含兩個範例應用程式：一個通用聊天機器人和一個圖像生成器，展示了這種設計在實踐中的應用。

Promptions 非常適合用戶需要提供情境但不想全部寫出來的介面。用戶無需輸入冗長的解釋，只需調整引導 AI 回應的控制項，即可符合其偏好。

進一步探索的問題

Promptions 為未來的研究提出了重要問題。關鍵的易用性挑戰包括釐清動態選項如何影響 AI 輸出，以及管理多個控制項的複雜性。其他問題涉及如何在即時調整與持久設定之間取得平衡，以及如何讓用戶協作分享選項。

在技術方面，問題集中在如何生成更有效的選項、驗證和客製化動態介面、自動收集相關情境，以及支持跨會話儲存和分享選項集。

這些問題，連同對協作、倫理、安全和擴展性的更廣泛考量，正引導著我們在 Promptions 及相關系統上的持續工作。

工具
在 Microsoft Foundry Labs 探索 Promptions

透過將 Promptions 開源，我們希望幫助開發者創造更聰明、更具響應性的 AI 體驗。

在 Microsoft Foundry Labs 探索 Promptions (在新分頁中開啟)

這篇文章 Promptions 透過動態 UI 控制項讓 AI 提示更精確最初發表於 Microsoft Research。

— Microsoft Research