歡迎

你的個人知識庫

從開放網路上發現值得讀的內容，收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。

Show HN：EvalView - 適用於 AI 代理的 pytest 風格測試（預算、幻覺）

Show HN：EvalView - 適用於 AI 代理的 pytest 風格測試（預算、幻覺）

Hacker News·4 個月前

EvalView 是一個開源的、pytest 風格的 AI 代理測試框架。它支援 YAML 場景、工具呼叫檢查、成本/延遲和安全評估，並提供 CI 相容的報告。

暫無內容

— Hacker News

相關文章

Show HN：具備語義驗證的開源AI代理測試框架
7 個月前
Show HN：SemanticTest – 使用語義驗證測試 AI 代理（開源）
7 個月前
Show HN：透過模擬對話來交付可靠的 AI 代理
7 個月前
Show HN：PromptDev – 跨供應商的 AI Agent 提示評估與測試
8 個月前
Show HN：TimetoTest – AI 代理用於 UI 和 API 測試
4 個月前

相關文章

Show HN：具備語義驗證的開源AI代理測試框架
7 個月前
Show HN：SemanticTest – 使用語義驗證測試 AI 代理（開源）
7 個月前
Show HN：透過模擬對話來交付可靠的 AI 代理
7 個月前
Show HN：PromptDev – 跨供應商的 AI Agent 提示評估與測試
8 個月前
Show HN：TimetoTest – AI 代理用於 UI 和 API 測試
4 個月前