RAG / 知识库
MinerU
开源数据提取工具,PDF/网页转结构化数据
质量分70
70,405 Stars
unknown
medium
中文速读
MinerU 是 OpenDataLab 开发的开源数据提取工具。可从 PDF、网页提取结构化数据,支持版面分析和表格提取。
适合
- LLM 数据管线
- RAG 数据准备
不适合
- 普通 PDF 查看
选型答案
MinerU 适合什么场景?LLM 数据管线;RAG 数据准备
MinerU 的试用和部署门槛如何?已发现 2 个试用、文档或演示入口,可从页面的“快速试用”区域打开。 当前难度标记为“中等难度”,许可证记录为“unknown”。
选择 MinerU 时要注意什么?普通 PDF 查看
数据来源和更新时间GitHub 仓库 opendatalab/MinerU,最近记录的推送时间为 。
标签
数据提取PDFRAG