CTCの学習では、通常の交差エントロピー損失ではなく、縮約すると正解音素列と一致するような全ての音素列の確率の和をネットワークの出力の「望ましさ」と考え、その対数にマイナスを付けた関数を損失関数とします。例えば、縮約すると /h a i/ という音素列と一致するような長さ5の音素列...
負の無限大からxに積分される、正規(ガウス)確率密度関数で示す領域がdoubleの引数yに等しい場合のdoubleの値xを返します(平均が0、分散が1であることを前提としています)。 詳細は、https://dst.lbl.gov/ACSSoftware/colt/api/cern/jet/stat/Probability.html#normalInverse(double)を参照してくださ...