它具备轻量级、易用、支持多种格式等特点,在文字识别任务中表现优异。 2.1.主要功能 图片文字识别:支持各种格式的图片,如 JPEG、PNG 等,能够快速准确地提取其中的文字。同时支持截图识别和批量识别图片。 PDF文件识别:不仅能识别 PDF 文件中的文字,还能保留文件的原有排版格式。即使是多页的 PDF 文件,也能一次性快...
它具备轻量级、易用、支持多种格式等特点,在文字识别任务中表现优异。 2.1.主要功能 图片文字识别:支持各种格式的图片,如 JPEG、PNG 等,能够快速准确地提取其中的文字。同时支持截图识别和批量识别图片。 PDF文件识别:不仅能识别 PDF 文件中的文字,还能保留文件的原有排版格式。即使是多页的 PDF 文件,也能一次性快...
Umi-OCR Umi-OCR 是一款免费开源的离线 OCR 文字识别软件。它无需联网,解压即用,支持截图、批量图片、PDF 扫描件的文字识别,能识别数学公式、二维码,并可生成双层可搜索 PDF。内置多语言识别库,界面支持多语言切换,提供命令行和 HTTP 接口调用功能。Umi-OCR 的插件化设计使其功能可扩展,例如导入不同语言识别...
那么只有key_mouse才会被忽略。pubsub_connector.py、pubsub_service.py这两个文本块得以保留。 文档识别 文档识别: 支持格式:pdf, xps, epub, mobi, fb2, cbz。 对扫描件进行OCR,或提取原有文本。可输出为双层可搜索PDF。 支持设定忽略区域,可用于排除页眉页脚的文字。 可设置任务完成后自动关机/休眠。 二维码...
功能强大:功能全面,涵盖截图 OCR、批量 OCR、PDF 识别、二维码识别以及数学公式识别等多种功能,一站式满足各种识别需求!Umi-OCR,满足你的各种OCR需求!Umi-OCR 的插件库不仅支持英文识别,还能处理数学公式、混合排版等多种复杂内容。通过安装不同的插件,你可以根据需求定制识别功能,轻松应对各种场景。还在等什么...
1、以批量文档OCR识别为例,将图片型的pdf拖入到左侧 2、设置要转换的页数,默认是识别所有的,我这里选择特定页数(第4页),如下图,点击页数后会跳出弹出框进行设置 3、设置排版解析方案,我试了下,选择【单栏-总是换行】效果会更好,后续解析入库方便
OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。 - hiroi-sora/Umi-OCR
Umi-OCR是一个免费、开源的可批量处理的离线OCR软件。它基于paddle,适用于 Windows7 x64 及以上版本。它支持截图OCR / 批量OCR / 二维码 / 公式识别(测试中) / PDF识别(测试中)等多种形式内容的识别。还支持命令行与http接口等调用方式。另外,它还支持批量OCR处理。
OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。 - Releases · hiroi-sora/Umi-OCR
在GitHub上看到了一个好用的OCR工具Umi-OCR,不仅支持批量导入图片、PDF文档识别而且开源免费,还能够在本地离线运行。可以说是为某些不适宜导入在线OCR应用的文档以及大体量本地OCR需求量身定做的软件。(顿时感觉自己的白描白买了) 软件在线提供两种版本下载,区别在于一种内置的识别引擎是Paddle引擎,一种内置的是Rapid...