日前,地平线语音组开源了基于全球最大多领域中文语音识别数据集 WenetSpeech的流式模型。依托于地平线强大的艾迪开发平台,该模型拥有夯实的云端训练赋能,识别效果更优,使用效果更鲁棒,并可以同时支持流式和非流式语音识别场景和任务。 模型开放地址: https://gzcb.cc/GitHub WenetSpeech数据集的诞生 在深度学习的推...
YouDub是一个开源工具,旨在自动化地将优质的YouTube视频进行翻译和配音,以便将其搬运到中文互联网上。该工具使用了AI语音识别技术将音频转换为文本,然后通过大语言模型将文本翻译成中文,最后通过AI声音克隆技术将中文转换为音频。这样,我们就可以创建出具有原始YouTuber音色的中文配音视频。 License Apache-2.0 license...
YouDub是一个开源工具,旨在自动化地将优质的YouTube视频进行翻译和配音,以便将其搬运到中文互联网上。该工具使用了AI语音识别技术将音频转换为文本,然后通过大语言模型将文本翻译成中文,最后通过AI声音克隆技术将中文转换为音频。这样,我们就可以创建出具有原始YouTube
YouDub是一个创新的开源工具,专注于将 YouTube 等平台的优质视频翻译和配音为中文版本。此工具融合了先进的 AI 技术,包括语音识别、大型语言模型翻译以及 AI 声音克隆技术,为中文用户提供具有原始 YouTuber 音色的中文配音视频。更多示例和信息,欢迎访问我的bilibili视频主页。你也可以加入我们的微信群,扫描下方的二维码...
AI 语音识别 大型语言模型翻译 AI 声音克隆 视频处理 贡献指南 许可协议 支持与联系方式 简介 YouDub是一个创新的开源工具,专注于将 YouTube 等平台的优质视频翻译和配音为中文版本。此工具融合了先进的 AI 技术,包括语音识别、大型语言模型翻译以及 AI 声音克隆技术,为中文用户提供具有原始 YouTuber 音色的中文配音...