2、大多数语音识别算法是基于短期频谱语音特征(MFCC梅尔频率倒频谱系数、LPCC线性预测倒频谱系数) 传统MFCC缺点:是音频劣化的情况下不可靠 解决方法:将语音感知特征和语音生成特征(分别由MFCC和LPC特征给出)结合起来,以学习一个联合特征空间,从而对整个语音链进行有效建模。(重点在无文本语音识别方面) 二、相关工作 现...
梅尔频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。主要用于语音数据特征提取和降低运算维度。例如:对于一帧有512维(采样点)数据,经过MFCC后可以提取出最重要的40维(一般而言)数据同时也达到了将维的目的。MFCC一般会经过这么几个步骤:预加重,分帧,加窗,快速傅里叶变换(FFT),梅尔滤波器组,...
mfcc( voicex, fs, Tw, Ts, alpha, hamming, R, M, C, L ); ceps_mfccx=mfccs(:); [cep,ER]=lpces(voicex,17,256,256); ceps_lpc=cep(2:17,:);%LPC %[lpc,ER]=lpces(voice,12,256,256); %ceps_lpcc=lpc2lpcc(cep);%LPCC ceps_lpcx=ceps_lpc(:); ceps=[ceps_mfccx(1000:...
举个例子:当我们使用 C 语言编程,调用 printf("Hello FishC\n") 这个 API 函数向显示器输出字符串"Hello FishC"的时候,我们并不需要关注显示器是如何绘制这个字符串的,我们只需要知道调用 C 语言提供的 printf() 这个 API 函数即可。 Windows 程序设计有两种方式: C语言方式(SDK)和 C++方式(对SDK函数进行包...
subplot(2,1,2),plot(f1',(20*log(abs(G ./ A)));grid;title('LPC谱');pause plot(abs(ifft(FTframe1 ./ (G ./ A)));grid;title('excited')plot(f1',20*log(abs(FFT_est(1 : length(f1')) .* A / G )));grid;pause find_pitch temp = FTframe1 - FFT_est(1 : ...
GMM model and LPC-MFCC ZENG Xin, ZHANG Xiongwei, SUN Meng, MIAO Xiaokong, YAO Kun (Army Engineering University, Nanjing 210007, Jiangsu, China)Abstract: Spectrum conversion is a key technique in voice conversion. At present, most of vocal tract spectrum conver-sion methods are first to ...
MFCC(Mel-frequency cepstral coefficients):梅尔频率倒谱系数。梅尔频率是基于人耳听觉特性提出来的, 它与Hz频率成非线性对应关系。梅尔频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。主要用于语音数据特征提取和降低运算维度。例如:对于一帧有512维(采样点)数据,经过MFCC后可以提取出最重要的40...