2. 下载中英文超轻量文本识别模型 ch_PP-OCRv3_xx ch_PP-OCRv3_xx 下载地址如下: 检测模型:https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar 识别模型:https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar 有一点需要说明的是,这里我们下载都...
图中可以看到对于ImageNet 1000图像分类任务,MobileNetV3在相同预测速度的情况下,准确率最好。因此我们选择MobileNetV3作为骨干网络。表1对比了文本检测使用不同尺度的MobileNetV3的效果、模型大小和预测速度,可以看到不同尺度的MobileNetV3差异还是比较明显。PP-OCR中选择MobileNetV3_large_x0.5对效果和效率进行折中。选择这...
2. 超轻量骨干网络选择 和文本检测类似,PP-OCR也是采用MobileNetV3作为文本方向分类器的骨干网络。由于这个任务相对比较简单,所以使用了MobileNetV3_small_x0.35作为骨干网络。表1对比了MobileNetV3_small_x0.35和MobileNetV3_small_x0.5,识别准确率差别不大,但是模型大小减小非常明显。此外,对比了其他方法使用的ShuffleNet...
根据PP-OCRv3: More Attempts for the Improvement of Ultra Lightweight OCR System论文描述,主要是开源数据集+百度自有数据集+互联网爬取+虚拟生成的数据集,以下为原文针对文本检测与文本识别数据集的介绍,由于方向分类在v3中未推出新的模型,没有描述。 For text detection, there are 127k training images and ...
如之前文本检测所述,采用余弦学习率可以有效提升模型效果。在文本识别中,同样非常有效。从表3可以看到,采用余弦学习率,识别准确率可以提升1.5%左右。 6.增大特征图分辨率 在PP-OCR中,文本识别的输入分辨率是3 * 32 * 320。MobileNetV3的原始stride变化策略并不适合文本识别。为了保留更多的水平方向图像的信息,除了第...
(3)识别模型优化1:PP-LCNet 轻量级骨干网络。PP-LCNet是基于MobileNetV1改进的新的骨干网络,精心设计激活函数、SE模块位置、大的卷积核位置和输出特征优化。对比mobilenetv3,识别准确率可比情况下,CPU上可以加速38%。实验表明,与PP-OCR的文本识别相比,将骨干网络从mv3换成PP-LCNet,识别准确率提升2.6%。
2. 下载中英文超轻量文本识别模型 ch_PP-OCRv3_xx ch_PP-OCRv3_xx 下载地址如下: 检测模型:https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar 识别模型:https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar ...