Tendril:一個能自行構建並註冊工具的自我擴展代理程式
Tendril 是一個自我擴展的代理程式沙盒,展示了代理程式能力模式,讓模型能在不同對話間自主發現、構建並重複使用工具。它透過僅有的三個引導工具來管理不斷增長的能力註冊表,並將這些能力以純文字檔案形式儲存,簡化了代理程式的運作迴圈。
背景
Tendril 是一個基於 AWS Strands SDK 與 Tauri 開發的自我擴展型代理人沙盒,其核心理念在於「代理人能力模式」。與傳統預設大量工具的框架不同,Tendril 僅提供三個基礎工具,讓模型在執行任務時自主發現、構建並註冊新工具,使代理人能隨著使用次數增加而變得更加聰明,實現跨對話的工具重用。
社群觀點
開發者 walmsles 指出,Tendril 旨在解決編碼代理人在每個新對話中都必須「冷啟動」的痛點。他認為現有框架往往只定義了工具的功能與調用方式,卻缺乏結構化的判斷標準來決定工具何時該自動啟動。透過強制代理人只能運行已註冊的能力,Tendril 迫使模型在執行任務前必須先定義調用條件並註冊工具,從而累積成一個持續成長的能力庫。然而,他也坦言目前小型本地模型如 Qwen 或 Mistral 在處理這種自我擴展邏輯時表現不佳,仍需依賴 Claude Sonnet 等高階模型。
社群對於這種「自我擴展」的安全性與效率表達了顯著擔憂。部分評論者認為,讓代理人自發性地開發新能力可能導致失控,例如在未經授權下開發出存取銀行帳戶的功能。此外,隨著使用次數增加,註冊庫中可能會充斥著針對特定任務的冗餘工具或低品質代碼,這不僅會造成上下文膨脹,還可能因為工具 API 的不一致性導致後續調用失敗。有觀點戲稱這就像是模型在進行「自我解壓縮」,雖然減少了初始工具負擔,卻可能引入更複雜的管理問題。
針對這些挑戰,一些開發者分享了類似的實踐經驗。有人在家庭自動化系統中採用了更嚴格的審查機制,將代理人與工具服務分離,所有由模型生成的工具必須經過「對抗性審查員」的多次審核與加密處理,且代理人本身無法直接接觸憑證。另一派觀點則認為,這類系統的關鍵在於「情境讀取」而非單純的規則判斷。與其在系統提示詞中寫死「若無工具則構建」的邏輯,不如讓模型學會判斷當前工作狀態是否真的需要介入,以避免過度觸發工具而浪費 Token。
最後,討論也觸及了技術實現的本質。有評論認為這本質上是「工作流自動化」的另一種形式,將程式片段視為可重用的技能。雖然目前許多工具如 Claude Code 已經展現出強大的自我修復與擴展能力,但要建立一個跨語言、具備反射機制且穩定可靠的工具註冊系統,仍需要極高的基礎設施投入,而非單純依賴 LLM 生成代碼。
延伸閱讀
- Agent Capability Pattern 失敗案例分析:作者針對五款本地模型在自我擴展循環中失敗的詳細記錄。 (https://serverlessdna.com/strands/ai-agents/agents-know-what...)
- DCD Agent:留言者分享的家庭自動化代理人架構,強調工具構建與執行的安全隔離。 (https://dcd.fyi/agent)
- Gluon:一個聲明式的元解析器與轉譯器,旨在解決跨語言分佈式類型系統的挑戰。 (https://github.com/accretional/gluon)
- Swamp Club:另一種整合現有代理人並提供記憶偵錯功能的工具。 (https://swamp.club)
相關文章
其他收藏 · 0