返回搜索GitHub

RAG / 知识库

MinerU

开源数据提取工具,PDF/网页转结构化数据

质量分70
70,405 Stars
unknown
medium

中文速读

MinerU 是 OpenDataLab 开发的开源数据提取工具。可从 PDF、网页提取结构化数据,支持版面分析和表格提取。

适合

  • LLM 数据管线
  • RAG 数据准备

不适合

  • 普通 PDF 查看

选型答案

MinerU 适合什么场景?LLM 数据管线;RAG 数据准备
MinerU 的试用和部署门槛如何?已发现 2 个试用、文档或演示入口,可从页面的“快速试用”区域打开。 当前难度标记为“中等难度”,许可证记录为“unknown”。
选择 MinerU 时要注意什么?普通 PDF 查看
数据来源和更新时间GitHub 仓库 opendatalab/MinerU,最近记录的推送时间为

标签

数据提取PDFRAG