從開放網路上發現值得讀的內容,收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。
EvalView 是一個開源的、pytest 風格的 AI 代理測試框架。它支援 YAML 場景、工具呼叫檢查、成本/延遲和安全評估,並提供 CI 相容的報告。
暫無內容
— Hacker News
相關文章
Show HN:具備語義驗證的開源AI代理測試框架
7 個月前
Show HN:SemanticTest – 使用語義驗證測試 AI 代理(開源)
Show HN:透過模擬對話來交付可靠的 AI 代理
Show HN:PromptDev – 跨供應商的 AI Agent 提示評估與測試
8 個月前
Show HN:TimetoTest – AI 代理用於 UI 和 API 測試
4 個月前