然而,当前 TTS 系统所用的现有大规模开源数据集大都是英文或是多语种的,相比之下中文 TTS 领域明显缺乏相对广泛的开源数据集,这对大规模中文 TTS模型的研究构成了阻碍。 近期,西工大音频语音与语言处理研究组(ASLP@NPU)和深圳大数据研究院、香港中文大学、WeNet开源社区、上海彼格镁隆技术有限公司合作论文“WenetSpeec...
基于语言学本体构建,全面覆盖汉语多音字、音变等现象的高效中文TTS数据集。A linguistically grounded and comprehensive Chinese TTS dataset, efficiently covering Chinese polyphonic characters, phonological changes, and more. - danielwei0214/Chinese-TTS-Datase
11月20日,爱数智慧发布中文普通话真·萌童声语音合成(TTS)开源数据集。该数据集由真童声录制,为中文童声语音合成数据集子集,时长为15分钟,文本主要为日常用语。据了解,数据集全集包含2235句话,时长超2小时。这也是该童声第一次用于TTS录制。 随着智能终端市场的扩张,人机交互逐渐成为与智能世界对话的入口。在人机互...
StoryTTS是由上海交通大学构建的一个具有丰富声学和文本表达性的中文文本到语音(TTS)数据集。该数据集包含了61小时的连续且富有韵律的语音,并且配有精确的文字转录和丰富的文本表达性注释。数据源自普通话讲故事节目的录音,通过系统全面的标注框架,研究人员对文本表达性进行了深入分析,定义了五个不同的维度:修辞手法、...
国产大模型崛起了!声音效果媲美人类 实测趣丸科技X香港中文大学(深圳)开源的语音大模型MaskGCT,效果超惊艳。它在三个TTS基准数据集上都达到了SOTA效果,超过当前最先进的同类模型,独one无two!公测版本已上线趣丸千音平台(voi - 趣丸智能于20241030发布在抖音,已经收
数据介绍 样本数据预览 使用声明 查看原数据 README.md 该合成数据由一位音色成熟稳重的30岁男性声优在专业录音棚完成录制(录音棚背景噪音<18dB(A)),这名声优每周进行2-3次录音,总录音周期为2个月,录音内容选自网络小说。 产品库编号 King-TTS-162
元宇宙数据集 智能安防 智能安防 家居生活 家居生活 人脸识别 人脸识别 ChatGPT数据集 ChatGPT数据集 人工智能数据集交易平台 Home 人工智能数据集交易平台 TTS 语音合成 • 中文普通话 选择频道搜索 公开数据集 AI技术百科 人工智能数据集交易平台 人工智能模型 人工智能论文 法律法规库 20.1小时中文...
StoryTTS是由上海交通大学构建的一个具有丰富声学和文本表达性的中文文本到语音(TTS)数据集。该数据集包含了61小时的连续且富有韵律的语音,并且配有精确的文字转录和丰富的文本表达性注释。数据源自普通话讲故事节目的录音,通过系统全面的标注框架,研究人员对文本表达性进行了深入分析,定义了五个不同的维度:修辞手法、...
StoryTTS是由上海交通大学构建的一个具有丰富声学和文本表达性的中文文本到语音(TTS)数据集。该数据集包含了61小时的连续且富有韵律的语音,并且配有精确的文字转录和丰富的文本表达性注释。数据源自普通话讲故事节目的录音,通过系统全面的标注框架,研究人员对文本表达性进行了深入分析,定义了五个不同的维度:修辞手法、...
格式48kHz,16bit,wav,单声道录音环境专业录音棚环境录音内容涵盖新闻、日常口语、有声读物、诗词、广告、消息播送、娱乐等类