OCRmyPDF:Stirling-PDF使用OCRmyPDF进行文字识别,而OCRmyPDF又使用tesseract进行文本识别。 Tesseract OCR:支持不同语言的识别。此为高准确度识别包地址。 下载简体中文的训练识别包: 代码语言:javascript 复制 cd/root/data/docker_data/pdf/data/trainingData&&wget https://github.com/tesseract-ocr/tessdata/blob/...
这是一个功能强大的基于本地托管的基于pdf的操作工具,它使用Dorker,允许您在pdf文件上执行各种操作,例如分解合并、转换、重组、添加图像、旋转、压缩等等。这个本地托管的Web应用程序开始是一个100%的聊天制作的应用程序,已经发展到包括广泛的功能,以处理您的所有PDF需求。 1.2 Stirling-PDF功能 用于合并/拆分/旋转/...
直接打开Stirling-PDF 应用模板,然后点击右上角的 “去 Sealos 部署”。 如果您是第一次使用Sealos,则需要注册登录 Sealos 公有云账号,登录之后会立即跳转到模板的部署页面。 这里面有很多参数,如果你不知道这些参数是干嘛的,最好不要做任何改动,直接使用默认值就好。点击右上角的 “部署应用” 开始部署,部署完成...
使用 OpenCV 的 python 脚本需要此文件夹。 sudo mkdir /opt/Stirling-PDF &&\ sudo mv ./build/libs/Stirling-PDF-*.jar /opt/Stirling-PDF/ &&\ sudo mv scripts /opt/Stirling-PDF/ &&\ echo "Scripts installed." 对于非root用户,您可以使用以下命令将jar保留在Stirling-PDF的主目录中: mv ./build/l...
使用Docker部署Stirling-PDF,可以快速搭建环境并实现自动化管理。一、Stirling-PDF功能Stirling-PDF是一个完全交互式的GUI工具,可以对PDF文件进行各种操作,包括但不限于: 合并多个PDF文件为一个文件; 将一个PDF文件拆分为多个文件; 重新组织PDF页面的顺序; 以90度为增量旋转PDF页面; 删除PDF页面; 将多页布局的PDF...
🔺Stirling-PDF是一个可以托管在本地上的免费开源PDF操作工具,它功能非常强大,可以以近乎全能的方式对PDF 文件执行各种操作,包括拆分、合并、转换、重组、添加图像、旋转、压缩等,并且还支持很多付费PDF工具还不支持的OCR扫描功能,最主要的是,该程序原生支持中文,再也不用使用过程中会出现中文乱码的问题,绝对可以称得...
Stirling-PDF,一款强大的PDF编辑、处理神器,以其易于部署和使用的特点,迅速成为PDF文件管理者的优选工具。通过GitHub(Stirling-Tools/Stirling-PDF)获取源码,其功能丰富,包括合并、拆分、添加水印、设置密码与权限等,极大地满足了用户对PDF文件的编辑需求。部署Stirling-PDF的准备工作包括选择服务器和安装...
使用docker安装本地pdf工具集合Stirling-PDF,平时工作中需要处理pdf,市面上的很多工具都需要充会员才能使用,偶然发现了一个可私有化部署且易于使用的PDF在线工具,使用docker部署,使用起来非常方便,而且功能齐全。这里是官网:如果想本地部署。
windows上使用wsl的ubuntu部署stirling-pdf 由于要部署stirling-pdf需要docker环境,所以需要使用ubuntu系统,那么在win10/win11上最方便的方式就是使用wsl安装ubuntu然后再wsl上的ubuntu上进行部署,接下来就是整个步骤 在windows上使用wsl安装ubuntu,在powershell上使用wsl --install命令就可以默认安装ubuntu了,方便快捷...