传统的语音识别系统在识别中文时存在一些问题,比如难以区分同音字或近音字,这导致识别的准确性不高。目前大多数方法都是针对声学模型展开工作,未考虑语言模型在训练过程中对声学模型的影响。融合声学模型和语言模型的最常用的方法是浅层融合(Shallow Fusion),主要做法是分别训练声学模型和语言模型,然后组合它们的输出以引...
摘要 用于语音识别(SR)的深度神经网络在提供强大的语言计算和分析能力的同时,极易受到对抗性攻击影响,在人为不可察觉的情况下,造成语音转录错误,甚至是执行特定非法控制命令.本研究聚焦语音识别对抗攻击,首先,从攻击模型的角度,以...展开更多 The deep neural network provides powerful language computing and analysis...