近期,西工大音频语音与语言处理研究组(ASLP@NPU)和深圳大数据研究院、香港中文大学、WeNet开源社区、上海彼格镁隆技术有限公司合作论文“WenetSpeech4TTS: A 12800-hour Mandarin TTS Corpus for Large Speech Generation Model Benchmark”被语音研究顶级会议INTERSPEECH2024接收。该论文发布12800 小时的中文 TTS数据集Wenet...
一、WenetSpeech的特点与用途WenetSpeech数据集以其广泛的应用领域和高质量的标注而著称。它涵盖了各种环境下的语音样本,包括安静的室内环境、嘈杂的室外环境、不同的口音和说话风格等。这使得WenetSpeech成为一个极具挑战性的数据集,能够充分检验语音识别算法的性能。除了多样性和高质量,WenetSpeech还注重数据的安全性和...
Wenet 8.88 WenetSpeech: A 10000+ Hours Multi-domain Mandarin Corpus for Speech Recognition 2021 7 Kaldi 9.07 WenetSpeech: A 10000+ Hours Multi-domain Mandarin Corpus for Speech Recognition 2021 8 Espnet 9.7 WenetSpeech: A 10000+ Hours Multi-domain Mandarin Corpus for Speech Recognition ...
WenetSpeech4TTS 谢老师和Wenet团队在WenetSpeech数据集的基础上,重新整理出了一份专门针对合成任务的WenetSpeech4TTS数据集,并且基于该数据成功复现了VALL-E和NaturalSpeech2。 WenetSpeech4TTS总共包含了1.28万小时的中文语料,不限领域,并且根据DNSMOS分成了4档: 不过这个数据集的一个小小的不足之处在于无说话人信息...
WenetSpeech 2.0 虽然 WenetSpeech 将开源中文语音识别训练数据规模提升到一个新的高度,然而希望进一步进行扩展和完善:1.从领域角度,现有数据集在口音、中英文混合、会议、远场、教育、电话、语音助手等场景仍覆盖不足。2.从数据量角度,现有的2万+小时的总数据,对于无监督学习仍然远远不够。因此,WenetSpeech ...
日前,西北工业大学音频语音和语言处理研究组(ASLP Lab)、出门问问、希尔贝壳联合发布 1 万小时多领域中文语音识别数据集 WenetSpeech,在腾讯会议天籁实验室、华为昇思 MindSpore、 西安未来人工智能计算中心等机构大力支持下,该数据集目前已经开放下载。数据申请入口: h
WenetSpeech数据集 包含了10000+小时的普通话语音数据集,所有数据均来自 YouTube 和 Podcast。采用光学字符识别(OCR)和自动语音识别(ASR)技术分别标记每个YouTube和Podcast录音。为了提高语料库的质量,WenetSpeech使用了一种新颖的端到端标签错误检测方法来进一步验证和过滤数据。
WenetSpeech数据集 10000+小时的普通话语音数据集,使用地址:PPASR WenetSpeech数据集包含了10000+小时的普通话语音数据集,所有数据均来自 YouTube 和 Podcast。采用光学字符识别(OCR)和自动语音识别(ASR)技术分别标记每个YouTube和Podcast录音。为了提高语料库的质量,WenetSpeech使用了一种新颖的端到端标签错误检测方法来进...
WenetSpeech4TTS Update index.html 01d7039· Jun 9, 2024 History28 Commits raw Create Mos.png Apr 24, 2024 .DS_Store Merge branch 'main' of https://github.com/WenetSpeech4TTS/wenetspeech… Apr 24, 2024 .gitignore Merge branch 'main' of https://github.com/WenetSpeech4TTS/wenetspeech…...
日前,地平线语音组开源了基于全球最大多领域中文语音识别数据集 WenetSpeech的流式模型。依托于地平线强大的艾迪开发平台,该模型拥有夯实的云端训练赋能,识别效果更优,使用效果更鲁棒,并可以同时支持流式和非流式语音识别场景和任务。 模型开放地址: