数据集概述 KeSpeech 数据集收集了来自 34 个中国城市的 27,237 个人录制 1542 个小时的语音数据,包含普通话和 8 种方言。 可以用来进行跨语言语音识别、预训练等任务。 数据集特点 该数据集具有 4 个特点: KeSpeech 提供了包括内容转录、说话人身份和子方言在内的多种标签,因此支持多种语音处理任务,例如语音识...
Open Resources 公共资源 公共数据集 公共教程HOT 公共模型 OpenBayes 服务状态帮助与支持关于 搜索K 登录/注册 公共数据集/ KeSpeech 普通话和 8 种方言语音数据集/ 版本 V3 当前版本 概览版本1 v3最新版本当前版本 超过1 年前 处理完毕 174.39 GB 暂无版本描述...