python train.py -c configs/config.json -m 44k 如果成功开始训练,可以得到每个Epoch的时间、loss以及模型保存的信息: 建议至少训练1000个Epoch。 可以通过Ctrl+C停止训练。 四、音色替换 1. 准备干净的人声以及伴奏 so-vits-svc本质是对干净的人声进行音色替换,所以需要做替换的音频,也应该是干净的人声。 下载一...
配置文件存放在config文件夹,名为config.json 扩散模型的配置文件默认就行,如需查看参数,请见/config_template/diffusion_template.yaml (懒得去翻译了) all_in_mem,cache_all_data:加载所有数据集到内存中,硬盘IO过于低下、同时内存容量 远大于 数据集体积时可以启用(可以较大的提升训练速度) epoch 总最大训练轮...
A: 下载G模型和对应的config文件,放到本地的对应文件夹就行(.\logs\44k和.\configs) Q: 我实在不会搞了,请问UP能代训练吗?有偿的那种。 A: 不能。 Q: 我训练和推理都很顺利!现在已经做了一首翻唱了,想上传到B站,有什么注意事项吗? A:请勿在视频简介标注项目仓库和整合包作者信息。请标注视频中所使用...
python resample.py --skip_loudnorm(响度对齐,au中一般7db) python preprocess_flist_config.py --speech_encoder vec768l12 --vol_aug 修改配置文件: D:\sovit\so-vits-svc-4.1-Stable\logs\44k config.json vocoder_name: 选择一种声码器,默认为nsf-hifigan log_interval:多少步输出一次日志,默认为 200 ...
wav_filename: 待转换的歌曲model_filename: 模型文件名(如G_0.pth)speaker: 原始数据集的文件夹名config_filename: 配置文件名(如config.json) 执行推理后,生成的歌曲文件会在result目录下。 使用体验 山楂在Colab上运行so-vits-svc时,进行了大约800...
可以通过修改 4.0 模型的 config.json 对 4.0 的模型进行支持。需要在 config.json 的 model 字段中添加 speech_encoder 字段,具体如下:"model": { # 省略其他内容 # "ssl_dim",填256或者768,需要和下面"speech_encoder"匹配 "ssl_dim": 256, # 说话人个数 "n_speakers": 200, # 或者"vec768l12",...
python train.py-cconfigs/config.json-m44k 扩散模型(可选), 尚若需要浅扩散功能,需要训练扩散模型,扩散模型训练方法为: 代码语言:shell AI代码解释 python train_diff.py-cconfigs/diffusion.yaml 用tensorboard查看训练情况 代码语言:shell AI代码解释
可通过修改 4.0 模型的 config.json 对 4.0 的模型进行支持,需要在 config.json 的 model 字段中添加 speech_encoder 字段,具体见下 "model": { ... "ssl_dim": 256, "n_speakers": 200, "speech_encoder":"vec256l9" } 🆕 关于浅扩散 💬 关于...
You can modify some parameters in the generated config.json keep_ckpts: Keep the last keep_ckpts models during training. Set to 0 will keep them all. Default is 3. all_in_mem: Load all dataset to RAM. It can be enabled when the disk IO of some platforms is too low and the system...
You can modify some parameters in the generated config.json keep_ckpts: Keep the last keep_ckpts models during training. Set to 0 will keep them all. Default is 3. all_in_mem: Load all dataset to RAM. It can be enabled when the disk IO of some platforms is too low and the system...