本发明公开了一种基于SelfAttention的离线数学公式识别方法,包括:对输入的数学公式图像进行预处理;编码阶段:对数学公式图像进行特征提取;将提取的特征的隐向量转换为多头的自注意力机制输入所需的维度;对提取的特征的隐向量进行编码,获得特征结果向量;解码阶段:依次输入字符到嵌入层,获得嵌入向量;将特征结果向量以及嵌入向...
使用两种self-attention作为decoder的核心组件对编码的特征进行解码,端到端地实现了数学公式图像的识别问题以及latex代码序列生成的问题;与传统的基于lstm的深度学习架构相比,仅仅利用了注意力机制,不使用任何循环神经网络结构,避免了lstm的长距离依赖的问题,增加了容错率,也进一步提高了识别的准确...