语音识别的全称是自动语音识别(Automatic Speech Recognition,ASR),说得多了,就把“自动”省去了,认为“自动”是理所当然的了。语音识别属于序列转换技术,它将语音序列转换为文本序列。大体来说,这是一次搬运,是把一段话的表现形式从语音变成了文本,至于文本想要表达的深层含义(自然语言理解)、倾诉的感情(情感识别)...
由汤志远、李蓝天、王东组织撰写的《语音识别基本法》一书近日将由电子工业出版社出版。CSLT公众号“清语赋”将顺序刊载该书的全部章节。该书以语音识别为基础任务,介绍了语音识别的 基础原理、主流方法、Kaldi的…
《语音识别基本法:Kaldi实践与探索》结合当下使用广泛的Kaldi 工具,对语音识别的基本概念和流程进行了详细的讲解,包括GMM-HMM、DNN-HMM、端到端等常用结构,并探讨了语音识别在实际应用中的问题,包括说话人自适应、环境鲁棒性、小语种语音识别、关键词识别与嵌入式应用等,也对语音识别技术的相关前沿课题进行了介绍,包括...
《语音识别基本法:Kaldi实践与探索》是2021年电子工业出版社出版的图书,作者是汤志远。内容简介 语音是新一代人机交互的方式,语音识别是实现这一方式的关键环节,也是实现人工智能的基本步骤之一。本书结合当下使用广泛的Kaldi工具,对语音识别的基本概念和流程进行了详细的讲解,包括GMM-HMM、DNN-HMM、端到端等常用...