专利摘要显示,本发明公开了一种基于 YOLOv3 与 CRNN 算法的板坯号识别系统及方法,涉及钢铁生产技术领域,包括:图像采集模块,用于获取板坯的图像数据;目标检测模块,用于对板坯的图像数据进行目标检测,识别出板坯号所在区域;序列识别模块,用于对板坯号所在区域进行序列识别,获取字符序列;结果输出模块,用于对识别...
专利摘要显示,本发明公开了一种基于 YOLOv3 与 CRNN 算法的板坯号识别系统及方法,涉及钢铁生产技术领域,包括:图像采集模块,用于获取板坯的图像数据;目标检测模块,用于对板坯的图像数据进行目标检测,识别出板坯号所在区域;序列识别模块,用于对板坯号所在区域进行序列识别,获取字符序列;结果输出模块,用于对识别结果进行输出。
CRNN是一种结合了卷积神经网络(CNN)和循环神经网络(RNN)的序列识别模型,特别适合于处理变长序列数据。在文字识别中,CRNN能够自动从图像中提取特征,并将其转换为字符序列。 网络结构 CRNN主要由三部分组成:卷积层、循环层和转录层。 卷积层:用于从输入图像中提取特征序列。 循环层:通常采用双向LSTM(长短期记忆网络...
CRNN(Convolutional Recurrent Neural Network)是一种结合了卷积神经网络(CNN)和循环神经网络(RNN)的模型,特别适合于序列标注任务,如OCR中的字符识别。CRNN通过CNN提取图像特征,然后利用RNN(通常为LSTM或GRU)对特征序列进行建模,最终输出文本序列。 CRNN的优势: 端到端识别:无需对文本进行复杂的预处理,如字符切分,直...
1.CRNN(CNN+RNN(BLSTM)+CTC) 2.CNN+Seq2Seq+Attention 此项目采取CTPN + YOLO v3 + CRNN方式进行OCR识别,下面对该方案进行一个大致讲解(需对照源码理解)。 源码地址:https://github.com/chineseocr/chineseocr 一、检测文字朝向,调整文字识别倾斜角度 ...
金融界 2024 年 8 月 4 日消息,天眼查知识产权信息显示,南京钢铁股份有限公司申请一项名为“一种基于 YOLOv3 与 CRNN 算法的板坯号识别系统及方法“,公开号 CN202410586265.8…
(自然场景OCR检测(YOLOv3+CRNN))(中文+英文模型) 前言 最近对于自然场景下的OCR比较有兴趣,所以总结了一些目前OCR现状,并且找了一个自然场景OCR的项目练练手。本人新手小白,若出现理解不当的地方,还望指出。 简介 目前的主流自然场景OCR模型:文字检测+文字识别 文字检测:解决的问题是哪里有文字,文字的范围有多大...
(1)加载数据集的位置 在工程目录cnn+lstm下,打开trian_crnn.py文件,修改类OCRIter中初始化加载函数中图片和pkl文件的相对路径,训练集图片路径为./data/train/text,训练集标签pkl文件./data/train,测试集图片路径./data/test/text,测试集标签pkl文件./data/test,同时设置参数train_flag为True,在工程代码中修改读...
(1)加载数据集的位置 在工程目录cnn+lstm下,打开trian_crnn.py文件,修改类OCRIter中初始化加载函数中图片和pkl文件的相对路径,训练集图片路径为./data/train/text,训练集标签pkl文件./data/train,测试集图片路径./data/test/text,测试集标签pkl文件./data/test,同时设置参数train_flag为True,在工程代码中修改读...
在RNN中,conv5后是pool5;在SPP-net中,用SPP-layer替代原来的pool5,其目标是为了使不同大小输入图像在经过SPP-Layer后得到的特征向量长度相同。其原理如图如下所示 SPP与金字塔pooling类似,即我们先确定最终pooling得到的featuremap大小,例如4*4 bins,3*3 bins,2*2 bins,1*1 bins。那么我们已知conv5输出的featu...