從原始交互到可重用知識：重新思考 AI 代理的記憶機制

Microsoft Research·26 天前

微軟研究院推出 PlugMem，這是一個與任務無關的插件式記憶模組，能將原始交互歷史轉化為結構化的知識單元，從而提升 AI 代理的效率與性能。

重點一覽

當前的 AI 代理（AI agents）儲存了長期的互動歷史，但難以有效地重複利用。
原始的記憶檢索可能會以冗長且低價值的上下文淹沒代理。
PlugMem 將互動歷史轉化為結構化、可重複使用的知識。
單一、通用的記憶模組在減少記憶標記（memory tokens）使用的同時，提升了多種代理基準測試的性能。

這似乎有違直覺：給予 AI 代理更多的記憶反而會使其效率降低。隨著互動日誌的累積，它們變得龐大、充斥著無關內容，且越來越難以使用。

更多的記憶意味著代理必須在海量的過去互動中搜尋與當前任務相關的信息。缺乏結構的情況下，這些記錄會將有用的經驗與無關的細節混雜在一起，導致檢索速度變慢且可靠性下降。挑戰不在於儲存更多的經驗，而在於如何組織這些經驗，以便代理能快速識別當下最重要的內容。

在我們最近的論文「PlugMem: A Task-Agnostic Plugin Memory Module for LLM Agents」中，我們介紹了一種即插即用的記憶系統，能將原始的代理互動轉化為可重複使用的知識。PlugMem 不將記憶視為待檢索的文本，而是將歷史記錄組織成結構化知識，旨在支持代理行動時的決策。

認知科學在此提供了一個有用的框架。它區分了記住事件、了解事實以及了解如何執行任務。過去的事件提供了背景，但有效的決策依賴於從這些事件中提取的事實和技能。

這種區分促使我們改變了設計 AI 代理記憶的方式。PlugMem 通過將代理的互動歷史（如對話、文件和網頁會話）轉換為結構化、精簡的「知識單元」（knowledge units），實現了這一轉變，使其可以跨任務重複使用。

PlugMem 的運作原理

PlugMem 與傳統 AI 記憶系統的一個關鍵區別在於儲存的內容。傳統方法儲存文本塊或命名實體（對人、地點和概念的引用）。PlugMem 則將事實和可重複使用的技能作為記憶的基本構建塊。這種設計減少了冗餘，增加了信息密度，並提高了檢索精度。它圍繞三個核心組件構建：

結構化（Structure）。 原始互動被標準化並轉化為命題性知識（事實）和規範性知識（可重複使用的技能）。這些知識單元被組織成一個結構化的記憶圖譜，使知識能以專為重複使用而設計的形式儲存。

檢索（Retrieval）。 PlugMem 不檢索長篇文本，而是檢索與當前任務一致的知識單元。高層次的概念和推斷出的意圖充當路由信號，為當前的決策提取最相關的信息。

推理（Reasoning）。 檢索到的知識在傳遞給基礎代理之前，會被提煉成簡潔、任務就緒的指導，確保只有與決策相關的知識進入代理的上下文窗口。

圖 1 展示了這些組件如何協同工作。

圖 1. PlugMem 將不同類型的代理互動組織成以知識為中心的記憶圖譜，實現結構化的檢索與推理。

一個記憶，任何任務

大多數 AI 記憶系統是為單一工作構建的。對話記憶模組是圍繞對話設計的；知識檢索系統被調整為查找事實；網頁代理的記憶則針對導航頁面進行了優化。每種系統在目標環境中表現良好，但若不經過重大重新設計，很少能遷移使用。

PlugMem 採取了不同的方法。它是一個基礎記憶層，可以附加到任何 AI 代理上，而無需針對特定任務進行修改。

評估 PlugMem

為了測試 PlugMem，我們在三個對記憶有不同要求的基準測試中評估了同一個記憶模組：

在長篇多輪對話中回答問題
尋找跨越多篇維基百科文章的事實
在瀏覽網頁時做出決策

在這三項測試中，PlugMem 的表現一致優於通用檢索方法和特定任務的記憶設計，同時讓 AI 代理在此過程中使用的記憶標記預算顯著減少。

以效用而非大小衡量記憶

我們想評估正確的信息是否在正確的時刻傳達給代理，且不淹沒模型容量有限的上下文窗口。為此，我們引入了一項指標，衡量記憶模組貢獻了多少有用的、與決策相關的信息，並與其消耗的上下文量進行對比。

當我們將效用對比上下文消耗進行繪圖時，PlugMem 一致領先：如圖 2 所示，它提供了更多與決策相關的信息，同時比其他方法消耗更少的 AI 代理上下文。這些結果表明，將經驗轉化為知識——而非儲存和檢索原始日誌——能產生更有用且更高效的記憶。

圖 2. 在所有三個基準測試中，PlugMem 以更少的代理上下文窗口提供了更有用的記憶。

為什麼通用記憶能優於特定任務設計

通用記憶模組之所以能優於針對特定任務定制的系統，是因為決定性因素不在於專業化，而在於記憶是否能在代理需要時精確地提供正確的知識。結構化、檢索和推理各司其職，將這三者都做好比針對單一用例進行優化更為重要。

PlugMem 並非旨在取代特定任務的方法。它提供了一個通用的記憶基礎，可以在其上疊加任務適配。我們的實驗表明，將 PlugMem 與特定任務的技術相結合可以獲得進一步的提升。

邁向代理的可重複使用記憶

隨著 AI 代理承擔更長、更複雜的任務，其記憶需要從儲存過去的互動演變為主動提供可重複使用的知識。目標是讓代理能將有用的事實和策略從一個任務帶到下一個任務，而不是每次都從零開始。

PlugMem 代表了朝向該方向邁出的一步，將記憶設計植根於認知原理，並將知識視為重複使用的主要單位。隨著代理能力的擴展，以知識為中心的記憶可能被證明是下一代智能代理的關鍵構建塊。

程式碼和實驗結果已在 GitHub (在新分頁開啟) 公開，以便他人重現結果並進行自己的研究。

在新分頁開啟這篇貼文 From raw interaction to reusable knowledge: Rethinking memory for AI agents 首先出現在 Microsoft Research。

https://microsoft.com/en-us/research/blog/from-raw-interaction-to-reusable-knowledge-rethinking-memory-for-ai-agents/