RAG / 知识库 / AI 编程 / MCP / 开发者工具

llm_aided_ocr

用 LLM 校正和优化 Tesseract OCR 输出，将扫描 PDF 转为高质量 Markdown

质量分80

0 Stars

unknown

medium

中文速读

LLM-Aided OCR 通过 LLM（本地或 API）增强 Tesseract OCR 输出质量。支持错误校正、智能分块和 Markdown 格式化，特别适合处理扫描 PDF 文档。可用本地模型或 OpenAI API。

快速试用

Original PDFlink Raw OCR Outputlink LLM-Corrected Markdown Outputlink GitHublink

适合

需要处理大量扫描文档的开发者
RAG 知识库构建者
需要高质量 OCR 转换的团队

不适合

只需要基础 OCR 的用户
没有 GPU 且不想用 API 的用户

选型答案

llm_aided_ocr 适合什么场景？需要处理大量扫描文档的开发者；RAG 知识库构建者；需要高质量 OCR 转换的团队

llm_aided_ocr 的试用和部署门槛如何？已发现 4 个试用、文档或演示入口，可从页面的“快速试用”区域打开。当前难度标记为“中等难度”，许可证记录为“unknown”。

选择 llm_aided_ocr 时要注意什么？只需要基础 OCR 的用户；没有 GPU 且不想用 API 的用户

数据来源和更新时间GitHub 仓库 Dicklesworthstone/llm_aided_ocr，最近记录的推送时间为。

标签

ocrllmpdfdocument-processingmarkdown