产品规格书PDF文档配套程序立即购买 以人工智能深度学习为主题,在鲁班猫RK系列板卡上进行相关AI开发。 » 3.PP-ORCv4 3.PP-ORCv4¶ PP-OCRv4在PP-OCRv3的基础上进一步升级。 整体的框架图保持了与PP-OCRv3相同的pipeline,针对检测模型和识别模型进行了数据、网络结构、训练策略等多个模块的优化。 PP-OCRv4系...
PP-OCRv4检测模型在 PP-OCRv3检测模型的基础上,在网络结构,训练策略,蒸馏策略三个方面做了优化。首先,PP-OCRv4检测模型使用 PP-LCNetV3替换 MobileNetv3,并提出并行分支融合的 PFhead 结构;其次,训练时动态调整 shrink ratio 的比例;最后,PP-OCRv4对 CML 的蒸馏 loss 进行优化,进一步提升文字检测效果。...
PP-OCRv4是一个两阶段的OCR系统,包含检测模型、方向分类模型和识别模型。在检测和识别之间添加方向分类模型,将不同角度的文本检测框修正为水平检测框,方便识别模型完成行文本识别。编辑 为了适应服务器和边缘端不同场景的部署需求,PP-OCRv4提供两种推理模型权重版本:边缘端:中英文超轻量PP-OCRv4模型(16.1M) =...
PP-OCRv4效果速览 英文场景 多语言场景 下面上定量评测结果!PP-OCRv4在速度可比情况下,中文场景端到端Hmean指标相比于PP-OCRv3提升4.25%,效果大幅提升。具体指标如下表所示:测试环境:CPU型号为Intel Gold 6148,CPU预测时使用OpenVINO。除了更新中文模型,本次升级也优化了英文数字模型,在自有评估集上文本识别...
PP-OCRv4检测模型在PP-OCRv3检测模型的基础上,在网络结构,训练策略,蒸馏策略三个方面做了优化。首先,PP-OCRv4检测模型使用PP-LCNetV3替换MobileNetv3,并提出并行分支融合的PFhead结构;其次,训练时动态调整shrink ratio的比例;最后,PP-OCRv4对CML的蒸馏loss进行优化,进一步提升文字检测效果。 消融实验如下: 测试环境:...
英文数字场景,相比于PP-OCRv3英文模型提升6%。 多语言场景,优化80个语种识别效果,平均准确率提升超8%。 PP-OCRv4模型目前已随PaddleOCR 2.7版本正式发布,欢迎大家持续关注PaddleOCR~~~ GitHub项目地址 https://github.com/PaddlePaddle/PaddleOCR PP-OCRv4效果速览 ...
使用OpenVINO C# API可以直接读入PP-OCRv4模型(无需转换),并能方便快捷的将PP-OCRv4模型用C#代码部署在英特尔® CPU、独立显卡、集成显卡、NPU等硬件上。 如果你有更好的文章,欢迎投稿! 稿件接收邮箱:nami.liu@pasuntech.com 更多精彩内容请关注“算力魔方®”!
使用OpenVINO C# API可以直接读入PP-OCRv4模型(无需转换),并能方便快捷的将PP-OCRv4模型用C#代码部署在英特尔® CPU、独立显卡、集成显卡、NPU等硬件上。 如果你有更好的文章,欢迎投稿! 稿件接收邮箱:nami.liu@pasuntech.com 更多精彩内容请关注“算力魔方®”!
PP-OCRv4效果速览 英文场景 多语言场景 下面上定量评测结果! PP-OCRv4在速度可比情况下,中文场景端到端Hmean指标相比于PP-OCRv3提升4.25%,效果大幅提升。具体指标如下表所示: 测试环境:CPU型号为Intel Gold 6148,CPU预测时使用OpenVINO。 除了更新中文模型,本次升级也优化了英文数字模型,在自有评估集上文本识别准确...
首先,请克隆PP-OCRv4_OpenVINO到本地: git clone git clone https://github.com/openvino-book/PP-OCRv4_OpenVINO.git cd PP-OCRv4_OpenVINO 接着,安装依赖项: pip install -r requirements.txt 最后,请从 https://paddlepaddle.github.io/PaddleOCR/latest/model/index.html ...