数据集准备好后,在.\so-vits-svc\dataset_raw文件夹中新建一个文件夹,命名为该音色的名字,例如: .\so-vits-svc\dataset_raw\jayzhou 把所有声音片段放在都放在这个文件夹下。 三、模型训练 1. 导入训练集 确保激活了conda环境,且当前目录为.\so-vits-svc\,在command window中依次输入 python resample.py py...
二、准备训练数据集 1.录制自己声音:首先准备声音素材,最好是在安静的环境中录制的纯人声高清音频素材,最好别低于30分钟(至少 30 分钟的纯人声 / 歌声,1-2 小时最佳),声音文件格式WAV,录制的声音最好有高音和低音部分,这样转换出来的歌声效果更好,不然的话高音部分可能会沙哑变音。 2.声音处理:如果有噪声,通...
配置参数如下: wav_filename: 待转换的歌曲model_filename: 模型文件名(如G_0.pth)speaker: 原始数据集的文件夹名config_filename: 配置文件名(如config.json) 执行推理后,生成的歌曲文件会在result目录下。 使用体验 山楂在Colab上运行so-vits-svc时...
最后请保证你的训练集是wav格式,改文件后缀为wav并不能把mp3文件改成wav格式,请自己找格式工厂之类的音频格式转换软件。 另外,文件名包含一些特殊符号有可能导致后续步骤出错,保险起见建议文件名改为纯英文数字的形式,数据集量较大请自行百度文件名批量修改的方法。 Q3:数据集是纯说话/纯唱歌/说话和唱歌混在一起可...
01.选择实例 可以随便选一个,然后扩容一下磁盘,我选择扩容150g,现在的价格是0.0066 元 gb/天,这样就是每天固定扣一块钱。 因为我已经提前准备好了数据集,包括切...
使用响度嵌入后训练出的模型将匹配到输入源响度,否则为训练集响度。(可简单理解为训练后模型的音量会与数据集匹配,否则会与底模匹配) 若使用响度嵌入,需要增加--vol_aug参数,比如:python preprocess_flist_config.py --speech_encoder vec768l12 --vol_aug...
答:数据集切片切太长了,5-10秒差不多。 报错:CUDA error: CUBLAS_STATUS_NOT_INITIALIZED when calling 'cublasCreate(handle)' 答:爆显存了,基本上跟CUDA有关的报错大都是爆显存…… 报错:torch.multiprocessing.spawn.ProcessExitedException: process 0 terminated with exit code 3221225477 ...
so-vits-svc 部署用数据集 喜爱 0 实训用 柠 柠栀gardenia 2枚 CC0 智能语音 0 12 2023-07-19 详情 相关项目 评论(0) 创建项目 文件列表 hubert4.0.onnx G_0.pdparams D_0.pdparams yuuka.pdparams nahida.pdparams azi.pdparams hubert4.0.onnx (279.76M) 下载...
all_in_mem,cache_all_data:加载所有数据集到内存中,硬盘IO过于低下、同时内存容量远大于 数据集体积时可以启用(可以较大的提升训练速度) epoch总最大训练轮数,中途可中断训练,继续训练会从保存的最后一个模型处开始训练,不一定需要全部训练完,一般3000,4000就可以试试效果,大概1w,2w就能比较好的拟合了batch_size...
深度学习模型在计算机视觉任务中表现出色,其中SO-ViTS-SVC 是一种被广泛应用的模型。本文将详细描述SO-ViTS-SVC模型的训练过程,从数据准备、网络结构设计、模型训练等方面进行阐述,旨在帮助读者全面了解该模型,并为其在相关领域的应用提供指导。一、数据准备:1.确定训练数据集的目标任务和分类类别。2.收集并准备...