RAG / 知识库 / AI 编程 / MCP / 开发者工具
llm_aided_ocr
用 LLM 校正和优化 Tesseract OCR 输出,将扫描 PDF 转为高质量 Markdown
质量分80
0 Stars
unknown
medium
中文速读
LLM-Aided OCR 通过 LLM(本地或 API)增强 Tesseract OCR 输出质量。支持错误校正、智能分块和 Markdown 格式化,特别适合处理扫描 PDF 文档。可用本地模型或 OpenAI API。
适合
- 需要处理大量扫描文档的开发者
- RAG 知识库构建者
- 需要高质量 OCR 转换的团队
不适合
- 只需要基础 OCR 的用户
- 没有 GPU 且不想用 API 的用户
选型答案
llm_aided_ocr 适合什么场景?需要处理大量扫描文档的开发者;RAG 知识库构建者;需要高质量 OCR 转换的团队
llm_aided_ocr 的试用和部署门槛如何?已发现 4 个试用、文档或演示入口,可从页面的“快速试用”区域打开。 当前难度标记为“中等难度”,许可证记录为“unknown”。
选择 llm_aided_ocr 时要注意什么?只需要基础 OCR 的用户;没有 GPU 且不想用 API 的用户
数据来源和更新时间GitHub 仓库 Dicklesworthstone/llm_aided_ocr,最近记录的推送时间为 。
标签
ocrllmpdfdocument-processingmarkdown