前言 机器学习大多数属于浅层模型(如GMM、HMM),浅层模型非线性变换能力较弱,不足以刻画复杂的语音数据(高维特征),识别性能提升非常有限,因此本课题针对声学模型GMM-HMM进行改进。由于GMM的输入是单帧,忽…
LSTM的这一特性使其在语音识别领域大放异彩。传统语音识别技术主要依赖于基于高斯混合模型(GMM)的隐马尔可夫模型(HMM),但在处理复杂环境下的语音数据时,其识别效果往往不尽如人意。而基于LSTM的深度学习模型则能够更好地处理这些问题,使得语音识别的准确率得到显著提升。二、LSTM在语音识别中的应用 端到端语音识别端到...
C-VGMM VIM:我们使用了基于机动的变分高斯混合模型,并以[10]中描述的基于马尔可夫随机场的车辆相互作用模型作为我们的第二基线。我们修改模型以使用本工作中描述的机动类,以便进行公平的比较。 Gail-GRU:我们考虑了[4]中描述的基于生成性对抗性模仿学习的GRU模型。由于在这两部作品中都使用了相同的数据集,所以我们...
model = LSTM_Regression(input_size=1, hidden_size=8, output_size=1, num_layers=2)# 导入模型并设置模型的参数输入输出层、隐藏层等model = model.to(device) train_loss = [] loss_function = nn.MSELoss() optimizer = torch.optim.Adam(model.parameters(), lr=1e-5, betas=(0.9,0.999), eps...
模型通过GMM算法、R通道自适应滤波和中值滤波准确提取图像的火焰前景和特征,以量化熔盐电解反应的剧烈程度,进而判断稀土熔盐电解处于原料含量过多或含量正常状态;然后利用GA-LSTM神经网络建立熔盐表面火焰特征和稀土熔盐电解过程原料含量状态的非线性映射关系。结果表明:模型的识别精度高达99.79%,具有较好的泛化性,为实现稀土...
针对配电网干式变压器监测手段有限导致的监测数据种类较少,故障预警难度较大的问题,提出了一种基于长短期记忆结合高斯混合模型(long short-term memory and gaussian mixture model,LSTM-GMM)算法的配电网干式变压器绕组故障双参数预警模型.首先,将监测数据预处理后提取与变压器绕组温度强相关的特征值,作为LSTM网络的输入;...
从声学模型角度分析,传统的语音识别系统的声学模型普遍采用的是基于GMM-HMM的声学模型,其中,GMM用于对语音声学特征的分布进行建模,HMM则用于对语音信号的时序性进行建模。2006年深度学习兴起以后,深度神经网络(Deep Neural Networks,DNN)被应用于语音声学模型。2009年,Hinton及其学生将前馈全连接深度神经网络应用于语音识别...
机动-LSTM(M-LSTM):最后考虑了本文提出的模型。由于每条基线都进行单峰预测,为了进行公平的比较,我们使用了我们所提出的模型所给出的最大概率与机动相对应的预测。 C.结果 表一显示了被比较的模型的预测误差的均方根值。我们注意到,文[4]提出的M-LSTM模型和Gail模型明显优于[10]的CV基线模型和C-VGMM vim模型...
可以证明若fW为三层神经网络,且状态数有限, 则RNN可以模拟GMM-HMM。 RNN分类 RNN可以根据输入和输出的数量关系,分为以下几类: 1. 输入与输出多对多 典型应用:大词汇连续语音识别、机器翻译 RNN做语音识别: 输入特征向量,输出对应的文字。用RNN进行Triphone的识别,在TIMIT数据集上获得了比DNN-HMM更高的识别率。
表一显示了被比较的模型的预测误差的均方根值。我们注意到,文[4]提出的M-LSTM模型和Gail模型明显优于[10]的CV基线模型和C-VGMM vim模型,这表明了递归神经网络在汽车非线性运动建模中的优越性。特别是,对于较长的预测间隔,RMS值的减少更加明显。我们还注意到,与Gail模型相比,M-LSTM对所有预测区间的预测误差都...