AI 编程 / MCP
deepeval
LLM 应用评估框架
质量分82
0 Stars
unknown
medium
中文速读
DeepEval 是专门用于评估 LLM 应用质量的测试框架,提供多种评估指标和 Colab demo。
快速试用
暂未发现稳定的 Demo 或视频入口。
适合
- 开发 LLM 应用的团队
- 需要 AI 质量保证的工程师
不适合
- 只需要简单 prompt 测试的用户
选型答案
deepeval 适合什么场景?开发 LLM 应用的团队;需要 AI 质量保证的工程师
deepeval 的试用和部署门槛如何?暂未发现稳定的 Demo、视频或文档入口,适合先从 GitHub README 和 issues 判断成熟度。 当前难度标记为“中等难度”,许可证记录为“unknown”。
选择 deepeval 时要注意什么?只需要简单 prompt 测试的用户
数据来源和更新时间GitHub 仓库 confident-ai/deepeval,最近记录的推送时间为 。
标签
LLM评估测试框架AI质量