核心是调用model.ctc_greedy_search()算法。 ctc_greedy_search() ctc_greedy_search算法的脑图,重要的点是三个 上面给出了ctc_greedy_search算法的脑图,重要的点是三个: 其一,对输入wav frame的基于conformer encoder layers的编码,例如12层; 其二,使用一个线性层,512 -> 5502,为每个frame的原本的512维度向量...
贪心搜索 (greedy search) 原理: 虽然 p(l|x) 难以有效的计算,但是由于 CTC 的独立性假设,对于某个具体的字符串 π(去 blank 前),确容易计算: 因此,我们放弃寻找使 p(l|x) 最大的字符串,退而寻找一个使 …
而常用的CTC解码算法一般有Greedy Search Decode(贪心搜索)、Beam Search Decode(束搜索)、Prefix Beam Search Decode(前缀束搜索)等,其中又以Greedy Search Decode(贪心搜索)和Prefix Beam Search Decode(前缀束搜索)使用的最多,本文将使用Python代码逐一实现上述三种算法。 1 Greedy Search Decode(贪心搜索) 1.1 原理...
而常用的CTC解码算法一般有Greedy Search Decode(贪心搜索)、Beam Search Decode(束搜索)、Prefix Beam Search Decode(前缀束搜索)等,其中又以Greedy Search Decode(贪心搜索)和Prefix Beam Search Decode(前缀束搜索)使用的最多,本文将使用Python代码逐一实现上述三种算法。 1 Greedy Search Decode(贪心搜索) 1.1 原理...