newsencenewsence
探索
歡迎

你的個人知識庫

從開放網路上發現值得讀的內容,收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。

了解更多
Show HN:EvalView - 適用於 AI 代理的 pytest 風格測試(預算、幻覺)

Show HN:EvalView - 適用於 AI 代理的 pytest 風格測試(預算、幻覺)

Hacker News·4 個月前

EvalView 是一個開源的、pytest 風格的 AI 代理測試框架。它支援 YAML 場景、工具呼叫檢查、成本/延遲和安全評估,並提供 CI 相容的報告。

暫無內容

— Hacker News

相關文章

  1. Show HN:具備語義驗證的開源AI代理測試框架

    7 個月前

  2. Show HN:SemanticTest – 使用語義驗證測試 AI 代理(開源)

    7 個月前

  3. Show HN:透過模擬對話來交付可靠的 AI 代理

    7 個月前

  4. Show HN:PromptDev – 跨供應商的 AI Agent 提示評估與測試

    8 個月前

  5. Show HN:TimetoTest – AI 代理用於 UI 和 API 測試

    4 個月前

相關文章

  1. Show HN:具備語義驗證的開源AI代理測試框架

    7 個月前

  2. Show HN:SemanticTest – 使用語義驗證測試 AI 代理(開源)

    7 個月前

  3. Show HN:透過模擬對話來交付可靠的 AI 代理

    7 個月前

  4. Show HN:PromptDev – 跨供應商的 AI Agent 提示評估與測試

    8 個月前

  5. Show HN:TimetoTest – AI 代理用於 UI 和 API 測試

    4 個月前