一、下载so-vits-svc 1. 创建新的conda环境 2. Git clone项目 3. 安装所需的Python环境 4. 下载预训练模型文件 二、准备训练集 1. 歌曲下载 2. 提取人声 3. 音频切片 三、模型训练 1. 导入训练集 2. 开始训练 四、音色替换 1. 准备干净的人声以及伴奏 2. 打开WebUI 五、人声伴奏混合 So-vits-svc...
重要!请提前下载训练需要用到的底模,参考 2.2.2 预训练底模。 推理:需准备底噪<30dB,尽量不要带混响和和声的干音进行推理。环境依赖本项目需要的环境:NVIDIA-CUDA | Python = 3.8.9(项目建议此版本) | Pytorch(cuda版,非cpu版) | FFmpeg1.1 so-vits-svc4.1 源码使用git 拉取源码。通过以下命令:git...
现… 果果 22.6k star! 用so-vits-svc克隆自己的声音并翻唱歌曲 so-vits-svc是一个声音克隆与音频转换的开源项目,可以完美的克隆自己的声音,并将其他音频转为自己的克隆声音。去年火遍全网的"AI孙燕姿"就是用这个项目做的。学会之后,五音不全… AI技术实战...
建议直接点击访问[官方文档](https://github.com/svc-develop-team/so-vits-svc) 2023.8.2文档更新: 1. 提供4.1训练底模,需自行下载,下载地址:https://huggingface.co/Sucial/so-vits-svc4.1-pretrain_model 还包含扩散模型训练底模 2. 提供4.0训练底模,需自行下载,下载地址:https://huggingface.co/datasets...
✨ 2024.3.8 最新建议 ✨:目前 GPT-SoVITS 项目的 TTS 与 so-vits-svc 的文字转语音相比,训练集需求量更小,训练速度更快,效果更好,所以此处建议若想使用语音生成功能,请移步 GPT-SoVITS。也因此,建议大家使用歌声素材作为训练集来训练本项目。1
无底模训练损失过高 无法使用多卡训练 倡导模型数据共享 推一下国内的模型共享平台 BML Codelab基于JupyterLab 全新架构升级,支持亮暗主题切换和丰富的AI工具,详见使用说明文档。 So-VITS-SVC 4.0 飞浆版本 开屏雷击 什么?这不是PyTorch,这是百度的飞浆(PaddlePaddle)。我们这个AI Studio体积小方便携带,打开一个项目...
So-VITS-SVC 4.0飞浆版本梅花亲自指定预训练底模,包括生成模型、判别模型、HuBERT 4.0的onnx模型文件。 - 飞桨AI Studio
与DiffSVC 相比,在训练数据质量非常高时diffsvc有着更好的表现,对于质量差一些的数据集,本仓库可能会有更好的表现,此外,本仓库推理速度上比diffsvc快很多 模型简介 歌声音色转换模型,通过SoftVC内容编码器提取源音频语音特征,与F0同时输入VITS替换原本的文本输入达到歌声转换的效果。同时,更换声码器为 NSF HiFiGAN ...
[AI翻唱]so-vits-svc4.1更新,浅层扩散,获得更好的转换效果,本地/云端一键训练和使用教程 3023 3 20:17 App 最详细的AI音色转换So-vits-SVC4.1本地配置/训练/推理/使用教程 7665 -- 7:17 App 【AI语音-sovits4.0】云端部署sovits4.0推理教程 1.9万 3 9:16 App Sovits4.0教程-AI翻唱声音模型训练,Colab...
预训练底模文件: G_0.pth D_0.pth。放在logs/44k目录下。 扩散模型预训练底模文件: model_0.pt。放在logs/44k/diffusion目录下。扩散模型引用了DDSP-SVC的Diffusion Model,底模与DDSP-SVC的扩散模型底模通用。以下提供的底模文件部分来自“羽毛布団”的整合包,在此表示感谢。