MinerU扫描PDF转为MD文件格式 | 我现在手头有一堆 PDF 文件,它们包括书籍、论文等乱七八糟的东西。很多都是原始书籍的扫描键,最酸爽的是要么没有 OCR,要么 OCR 的质量很差。如果我想全文检索,那压根不可能。 MinerU[1] 就能很好的解决这个问题,这个开源工具可以把 PDF 文件用 AI 转化成 Markdown 格式的文件