找到训练的命令,第一条是训练扩散模型的命令,第二条是主模型训练命令,复制命令时别把!复制进去 进入到终端复制粘贴第一条命令训练扩散模型,扩散模型训练,一般训练个1-2w步就行了,按ctrl+c停止训练 再打开一个新的终端复制粘贴第二条命令训练主模型,也是按ctrl+c停止训练 模型保存再logs/44k里面 主模型是G开头...
扩散模型(可选), 尚若需要浅扩散功能,需要训练扩散模型,扩散模型训练方法为: python train_diff.py -c configs/diffusion.yaml 用tensorboard查看训练情况 tensorboard --logdir logs/44k --host=0.0.0.0 2dbf82e248e02abde1b16.png 407edfd7f243e3cdcff29.png 聚类模型训练(可选) python cluster/train_cluste...
1.租用新实例->关机换无卡模式 镜像:svc-develop-team/so-vits-svc/so-vits-svc-4.1-Stable:v7 2.移动项目文件夹到数据盘以节约系统盘空间 终端:mv /root/so-vits-svc /root/autodl-tmp 3.上传训练素材 可通过镜像或阿里云操作 训练用的数据放在dataset_raw文件夹 定位文件夹,终端:cd /root/autodl-tmp/s...
so-vits-svc是基于VITS的开源项目,VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)是一种结合变分推理、标准化流和对抗训练的高表现力语音合成模型。 环境 本文章使用的是腾讯云GPU计算型GN7,具体环境如下: 代码语言:shell 复制 # 系统环境 Ubuntu 22.04 LTS # 显卡环境 NV...
如果你打算在本地运行,需要确认你的电脑配置,最好有8G以上的N卡。如果是Mac、A卡或者显存不足,建议还是用云端处理比较好。 为了达到好的效果,建议准备30分钟以上的干净音频,格式为.wav。如果音频有背景噪音,需要进行降噪处理。山楂这次测试用的是5分钟左...
训练必须使用 GPU 进行训练!推理目前分为命令行推理和WebUI 推理,对速度要求不高的话 CPU 和 GPU 均可使用。 如需自己训练,请准备至少 6G 以上专用显存的 NVIDIA 显卡。 请确保电脑的虚拟内存设置到30G 以上,并且最好设置在固态硬盘,不然会很慢。 云端训练建议使用 AutoDL 平台。若你会使用 Google Colab,你也...
如果出现memory错误提示,就是显存不足,可以调低batch_size的值,打开app.py,按ctrl+F搜索batch_size,将后面value的值调小,6G显存建议不超过4,值越大训练速度越快,但是对显存要求也越高。可以根据自己的显存大小适当调整,如果你的显存连6G都达不到的话建议不要在自己电脑上训练模型了,可以看我的云端部署教程,在云...
在哪下载? 项目地址:https://github.com/Ikaros-521/AI-Vtuber 相关整合/半整合包发布 https://github.com/Ikaros-521/AI-Vtuber/releases/ 夸克网盘:https://pan.quark.cn/s/e6755e65dc05 阿里云盘:https://www.aliyundrive.com/s/JRWomhcpeN9 我训练好的4.0的模型:https://github.com/Ikaros-521/so...
如果数据不大的话可以直接上传,如果数据比较大(超过500MB)的话可以压缩成分卷上传然后再在云端合并解压或者挂载自己的数据集。为了确保数据正确上传建议在云端校验MD5。 数据预处理 1. 重采样至 44100hz In [ ] !python resample.py 2. 自动划分训练集 验证集 测试集 以及自动生成配置文件 In [ ] !python prep...
In [ ] #说明 https://github.com/PlayVoice/so-vits-svc-5.0 云端版本的训练包,你需要将GitHub仓库so-vits-svc-5.0-main.zip放到目录下即可运行 1In [14] #源码解压 !unzip so-vits-svc-5.0-main.zip Archive: so-vits-svc-5.0-main.zip 40b681be8d221595cd91b10344693b0c8cd9b73c creating: so-...