https://github.com/VikParuchuri/marker 对比效果 我以一篇财报的PDF为例。财报通常比较复杂,包含表格,表格还不规整,还包括图片。 先说一下结论:MinerU 和 marker 是开源PDF文档解析中能够满足RAG的需求的。它们多多少少有一些问题,但是还能接受。其中两者解析段落已经非常准确了。并且maker是能够把表格解析为md结构...
新的将pdf转成markdown的工具marker解析效果不理想。VikParuchuri/marker: Convert PDF to markdown quickly with high accuracy (链接) 发布于 2023-12-13 01:23・IP 属地菲律宾 赞同 分享收藏 写下你的评论... 还没有评论,发表第一个评论吧登录知乎,您可以享受以下权益: 更懂你的优质内容...