TCN Transformer CTC的端到端语音识别 谢旭康,陈 戈,孙 俊 ,陈祺东 (江南大学人工智能与计算机学院,江苏无锡214122)摘 要:基于Transformer的端到端语音识别系统获得广泛的普及,但Transformer中的多头自注意力机制对输入 序列的位置信息不敏感,同时它灵活的...
端到端中文语音识别方法,属于语音识别领域。 针对目前现有技术的问题,本发明首先提出使用 时序卷积神经网络(TCN)来加强神经网络模型对 位置信息的捕捉,其次在上述基础上融合连接时 序分类(CTC),提出了识别中效果更好,泛化性更 强的TCN‑Transformer‑CTC模型。不使用任何语 ...
基于Transformer的端到端语音识别系统获得广泛的普及,但Transformer中的多头自注意力机制对输入序列的位置信息不敏感,同时它灵活的对齐方式在面对带噪语音时泛化性能较差.针对以上问题,首先提出使用时序卷积神经网络(TCN)来加强神经网络模型对位置信息的捕捉,其次在上述基础上融合连接时序分类(CTC),提出TCN-Transformer-CTC模...
1.基于TCN‑Transformer‑CTC的端到端中文语音识别方法, 其特征在于, 步骤如下:步骤一、 数据的预处理对于语音数据进行预加重、分帧、加窗,进行快速傅里叶变换, 计算谱线能量,进行Mel滤波, 取对数得到80维Fbank特征; 将预处理后的数据分为训练集和验证集;步骤二、建立时间序列卷积网络‑转换器‑连接性时序...
TCN-Transformer-CTC的端到端语音识别 基于Transformer的端到端语音识别系统获得广泛的普及,但Transformer中的多头自注意力机制对输入序列的位置信息不敏感,同时它灵活的对齐方式在面对带噪语音时泛化性能... 谢旭康,陈戈,孙俊,... - 《计算机应用研究》 被引量: 0发表: 2022年 基于TCN-Transformer-CTC的端到端...
TCN-Transformer-CTC的端到端语音识别TCN-Transformer-CTC的端到端语音识别 谢旭康;陈戈;孙俊;陈祺东 【期刊名称】《计算机应用研究》 【年(卷),期】2022(39)3 【摘要】基于Transformer的端到端语音识别系统获得广泛的普及,但Transformer中的多头自注意力机制对输入序列的位置信息不敏感,同时它灵活的对齐方式在面对...