返回搜索GitHub

AI 编程 / MCP

deepeval

LLM 应用评估框架

质量分82
0 Stars
unknown
medium

中文速读

DeepEval 是专门用于评估 LLM 应用质量的测试框架,提供多种评估指标和 Colab demo。

快速试用

暂未发现稳定的 Demo 或视频入口。

适合

  • 开发 LLM 应用的团队
  • 需要 AI 质量保证的工程师

不适合

  • 只需要简单 prompt 测试的用户

选型答案

deepeval 适合什么场景?开发 LLM 应用的团队;需要 AI 质量保证的工程师
deepeval 的试用和部署门槛如何?暂未发现稳定的 Demo、视频或文档入口,适合先从 GitHub README 和 issues 判断成熟度。 当前难度标记为“中等难度”,许可证记录为“unknown”。
选择 deepeval 时要注意什么?只需要简单 prompt 测试的用户
数据来源和更新时间GitHub 仓库 confident-ai/deepeval,最近记录的推送时间为

标签

LLM评估测试框架AI质量