主要研究方向为语音信息处理 .Email : ganzy@nwnu.edu.cn基于 DFCNN-CTC 端到端的藏族学生普通话发音偏误检测甘振业 1, 2 ,周世华 1 ,曾 浩 1 ,... 文档格式:PDF | 页数:6 | 浏览次数:210 | 上传日期:2020-11-10 17:44:57 | 文档星级: ...
DFCNNTransformer语音识别一般只是将语音转化成文字,识别的结果是没有标点的一连串汉字,这不利于读者阅读,也会影响后续任务的处理.因此,引入语音端点检测解决上述问题.同时针对传统的语言模型N-gram存在忽略字词之间语义的相似性,训练时的参数过大等问题,提出一种以全序列卷积神经网络DFCNN作为声学模型,Transformer作为语言...
项目名称《基于MindSpore,使用DFCNN和CTC损失函数的声学模型实现》 方案描述本项目的目标是使用MindSpore实现DFCNN+CTC的声学模型,将一句语音转化成一张特定模式的图像作为输入,然后通过DFCNN+CTC结构,对整句语音进行建模,实现输出单元直接与最终的识别结果(音节)相对应。 项目背景 自动语音识别(ASR)技术的目的是让机器能够...
计算机辅助语音训练系统需要检测非母语者的错误发音,并提供详细的指导性反馈,有助于第二语言学习者更有效地提高发音水平.利用深度全序列卷积神经网络(Deep full convolutional neural network,DFCNN)和链接时序分类(Connectionist temporal classification,CTC)技术,建立了一种用于发音偏误检测和诊断任务的端到端语音识别方法....