一、下载so-vits-svc 1. 创建新的conda环境 2. Git clone项目 3. 安装所需的Python环境 4. 下载预训练模型文件 二、准备训练集 1. 歌曲下载 2. 提取人声 3. 音频切片 三、模型训练 1. 导入训练集 2. 开始训练 四、音色替换 1. 准备干净的人声以及伴奏 2. 打开WebUI 五、人声伴奏混合 So-vits-svc...
来带下载的文件UVR5目录,解压安装UVR5,把模型文件放入model目录下,覆盖即可 UVR5可以对语音文件进行伴奏分离,去除和声,去除混响回声,打开UVR5 把音频文件输入输出目录,和模型类型,具体模型,勾选GPU conversion,WAV,基本选择这些就可以,其他默认,或者微调 提取人声的顺序流程是分离伴奏——去除和声——去除混响和回声 ...
艾伦·耶格尔声音模型下载链接: 奶牛快传:https://cowtransfer.com/s/afc512a8f1a342 口令:se54bo 解压后获得模型文件G_12800.pth和配置文件config.json 解压后将这两个文件放入so-vits-svc4.0的目录/logs/44k中,将speaker名称指定为eren,就可以进行声音推理。声音推理可以使用CPU执行,也就是说,在Mac或没有Nvidi...
数据集介绍 飞桨So-VITS-SVC 4.0梅花亲自指定的预训练底模,用这个训练就对啦! 文件列表 hubert4.0.onnx D_0.pdparams G_0.pdparams hubert4.0.onnx (279.76M) 下载 HuBERT 4.0 onnx模型关于AI Studio AI Studio是基于百度深度学习平台飞桨的人工智能学习与实训社区,提供在线编程环境、免费GPU算力、海量开源算法...
下载模型large-v2.pt, 该模型适配whisper-ppg-large 放在pretrain目录下 4. 若使用 cnhubertlarge 作为声音编码器 下载模型chinese-hubert-large-fairseq-ckpt.pt 放在pretrain目录下 5. 若使用 dphubert 作为声音编码器 下载模型DPHuBERT-sp0.75.pth
下载模型文件D_0.pth和G_0.pth,并将它们放在logs/44k目录下。 第三步:准备数据集 数据集目录结构如下: dataset_raw/├── speaker1/│ ├── audio1.wav│ ├── audio2.wav├── speaker2/│ ├── audio1.wav│ ├── audio2.wa...
歌声音色转换模型,通过SoftVC内容编码器提取源音频语音特征,与F0同时输入VITS替换原本的文本输入达到歌声转换的效果。同时,更换声码器为 NSF HiFiGAN 解决断音问题 注意 当前分支是32khz版本的分支,32khz模型推理更快,显存占用大幅减小,数据集所占硬盘空间也大幅降低,推荐训练该版本模型 如果要训练48khz的模型请切换到...
歌声转换模型。经过梅花一个月的通宵奋战,现在飞浆已经全面支持训练So-VITS-SVC 4.0。 什么?这不是PyTorch,这是百度的飞浆(PaddlePaddle)。 - 飞桨AI Studio
当前分支是32khz版本的分支,32khz模型推理更快,显存占用大幅减小,数据集所占硬盘空间也大幅降低,推荐训练该版本模型 如果要训练48khz的模型请切换到main分支 预先下载的模型文件 soft vc hubert:hubert-soft-0d54a1f4.pt 放在hubert目录下 预训练底模文件 G_0.pth 与D_0.pth 放在logs/32k目录下 预训练底...
大致实现原理就是,使用so-vits-svc这个工具先提取出你的声音的音色训练成模型,然后提取某个歌曲去音效的人声,通过so-vits-svc将原歌曲人声转换成你的人声,再配上音效,这样这首歌就翻唱完成了。下面讲一下本地部署so-vits-svc实现AI孙燕姿翻唱歌曲的具体操作流程。