上面叠加了 OCR 后的文本, 但是设为透明, 所以看上去是扫描的, 却可以复制.
上面叠加了 OCR 后的文本, 但是设为透明, 所以看上去是扫描的, 却可以复制.
这个PDF文件是双层的,上层是原始图像,下层是识别结果,这样可以100%保留原始版面效果,并且支持选择/复制...
详细方法图文:https://jingyan.baidu.com/article/48206aea985a8f216ad6b383.htmljingyan.baidu.com...
双层pdf,英文叫做searchable pdf 有一个可以把pdf转成searchable的网站,亲测好用,中文也支持。Make ...
应该是两层啦。一层文字 一层图片