WenetSpeech 除了含有 10000+ 小时的高质量标注数据之外,还包括2400+ 小时弱标注数据和 22400+ 小时的总音频,覆盖各种互联网音视频、噪声背景条件、讲话方式,来源领域包括有声书、解说、纪录片、电视剧、访谈、新闻、朗读、演讲、综艺和其他等10大场景,领域详细统计数据如下图所示。 WenetSpeech 收集过程 下图中给出...
具体来说,WenetSpeech选取置信度大于等于95%的数据作为高质量标注数据,这些数据被用于训练和验证语音识别模型。而置信度在0.6至0.95之间的数据则被视为弱监督数据,可用于半监督学习或强化学习等任务。三、如何有效下载 WenetSpeech 访问WenetSpeech的官方网站:wenet-e2e.github.io/WenetSpeech… 在网站首页找到“...
日前,西北工业大学音频语音和语言处理研究组(ASLP Lab)、出门问问、希尔贝壳联合发布 1 万小时多领域中文语音识别数据集 WenetSpeech,在腾讯会议天籁实验室、华为昇思 MindSpore、 西安未来人工智能计算中心等机构大力支持下,该数据集目前已经开放下载。数据申请入口: https://wenet-e2e.github.io/WenetSpeech/ 目前该...
按说你load之后会存放到 data_files 这个缓存文件夹里,WenetSpeech.json.aes.tgz 大小在621MB左右,看...
日前,中国领先的人工智能公司出门问问与西北工业大学音频语音和语言处理研究组(ASLP Lab)、希尔贝壳联合发布1万小时多领域中文语音识别数据集WenetSpeech,在腾讯会议天籁实验室、华为昇思 MindSpore、 西安未来人工智能计算中心等机构大力支持下,该数据集目前已经开放下载。
WenetSpeech 除了含有 10000+ 小时的高质量标注数据之外,还包括2400+ 小时弱标注数据和 22400+ 小时的总音频,覆盖各种互联网音视频、噪声背景条件、讲话方式,来源领域包括有声书、解说、纪录片、电视剧、访谈、新闻、朗读、演讲、综艺和其他等10大场景,领域详细统计数据如下图所示。
WenetSpeech 介绍 数据收集 数据校验 排行榜 WenetSpeech 2.0 致谢 日前,西北工业大学音频语音和语言处理研究组(ASLP Lab)、出门问问、希尔贝壳联合发布1万小时多领域中文语音识别数据集 WenetSpeech,在腾讯会议天籁实验室、华为昇思 MindSpore、 西安未来人工智能计算中心等机构大力支持下,该数据集目前已经开放下载。数据...