公共数据集> aishell-1混合四种飞机舱噪声aishell-1混合四种飞机舱噪声 3 训练验证测试集 蛋 蛋宝哒哒 1枚 GPL 2 语音识别 8 41 2024-05-07 详情 相关项目 评论(0) 创建项目 文件列表 wav_-15_to_15db_test_4noise.zip avg_10.pdparams wav_-15_to_15db_train_dev_4nois
AISHELL-1不仅是一个语音数据集,也是一个入门语音技术的基础方案,在Kaldi的样例里AISHELL-1覆盖了语音识别和声纹识别的方案。 对AISHELL-1的数据研究以及配套算法模型的优化,当今已经成为中文语音识别的Leaderboard。助力验证模型的结果、优化结果、结果的可信性分析已经成为AISHELL-1数据集新的价值体现。 Kaldi里的AISHELL...
AISHELL-1 是中文语音识别学术研究中应用最广泛的数据集,本期基于 AISHELL-1 的测试集,对各厂商进行测试。本场景属于非常干净的学术场景,不会加入后续滚动测试。 场景特点 ● 环境 室内,无噪声 ● 拾音设备 高保真麦克风,近场 ● 说话人 数据集制作过程中邀请的发音人(多人,分布在全国各地) ● 说话方式 根据预...
链接: https://pan.baidu.com/s/1Gak6C-aCxlnySOnb-Bi0YQ 提取码:28jf 数据来源:www. openslr.org
二、准备 aishell-1 数据集 2.1 wav文件 aishell-1提供了178小时的中文含标注的语音数据(aishell-1开源中文语音数据库),读者们下载该完数据集后,解压会得到: data_aishell/wav 存放wav的压缩文件,解压后会得到 train,dev,test 数据用于训练/开发/测试: ...
北京希尔贝壳科技有限公司是一家专注人工智能数据服务和辅助模型训练的创新公司。拥有行业领先的数据工程技术,针对人工智能大模型所必须的高质量数据提供精准的数据集、数据采集、标注、清洗、合成等方案。聚焦智能家居、智能座舱、机器人等人机交互场景做语音、文本、多模态数据服务。希尔贝壳在模型评测、AI辅助标注、AI数据...
数据集aishell1 三层wavnet dilation_cycles_3测试 在kws/egs/aishell1/dilated_conv/ASR_CTC_phones_WavNet.ipynb:第一次:124882/410212 30.44%;第二次:116781/410212 28.47% 三层wavnet dilation_cycles_3+DNN(256*100)测试 在no1:kws/egs/aishell1/dilated_conv/ASR_CTC_phones_WavNet_DNN.ipynb:118932/...
全球最大多领域中文语音识别数据集 WenetSpeech WenetSpeech是由西北工业大学音频语音和语言处理研究组(ASLP Lab)、出门问问、希尔贝壳联合发布的1万小时多领域中文语音识别数据集 。 WenetSpeech 除了含有 10000+ 小时的高质量标注数据之外,还包括2400+ 小时弱标注数据和 22400+ 小时的总音频,覆盖各种互联网音视频、噪...
这里主要用到data_aishell数据,resource_aishell那里没有怎么用到,代码在local/aishell_data_prep.sh,其中数据集有train(340人)、dev(40人)(好像没用到)、test(20人)三个文件夹,在aishell_data_prep.sh代码中,也替我们准备了必要的数据(utt2spk、wav.scp、text),这样就不需要我们自己手动输入了。
数据集应用社区圈7个主题内容 AI大学圈2个主题内容 应用案例:双目作为3D相机,仿照人类双眼感知世界 卷积神经网络(Convolutional Neural Networks) BP(back propagation)神经网络 SOM 自组织映射神经网络 独立同分布(iid,independently identically distribution)