data_aishell/wav 存放wav的压缩文件,解压后会得到 train,dev,test 数据用于训练/开发/测试: cd data_aishell for file in wav/*;do tar -xvf $file; done 1 2 3 4 2.2 标注文件 data_aishell/transcript 存放每个wav的中文标注, 这里已经是分词后的结果,因为一般asr的输出类型都是词序列,对于未分词的原始...
Homepage Benchmarks Edit Add a new resultLink an existing benchmark TrendTaskDataset VariantBest ModelPaperCode Speech Recognition AISHELL-1 FireRedASR-AED Papers Dataset Loaders Edit AddRemove No data loaders found. You cansubmit your data loader here. ...
local/aishell_data_prep.sh $data/data_aishell/wav $data/data_aishell/transcript 这里主要用到data_aishell数据,resource_aishell那里没有怎么用到,代码在local/aishell_data_prep.sh,其中数据集有train(340人)、dev(40人)(好像没用到)、test(20人)三个文件夹,在aishell_data_prep.sh代码中,也替我们准备了...