一、下载so-vits-svc 1. 创建新的conda环境 2. Git clone项目 3. 安装所需的Python环境 4. 下载预训练模型文件 二、准备训练集 1. 歌曲下载 2. 提取人声 3. 音频切片 三、模型训练 1. 导入训练集 2. 开始训练 四、音色替换 1. 准备干净的人声以及伴奏 2. 打开WebUI 五、人声伴奏混合 So-vits-svc...
So-vits-svc简明AI声音克隆指南 可以通过学习一个人的声音,对一首歌做音色替换。 一、准备工作 1.硬件环境:有N卡,且内存在6G以上,并安装了对应的CUDA环境 2.so-vits-svc整合包下载:https://www.yuque.com/umoubuton/ueupp5/sdahi7m5m6r0ur1r 3.相关工具(推荐)。 分离人声-UVR:https://github.com/Anjo...
So-VITS-SVC 4.0 训练/推理常见报错和Q&A 羽毛布団 · 148786阅读 数据集处理阶段 Q1:训练需要多少/多长的音频素材? A:数据集的数量和 长度都没有特别硬性的要求,每条长度五秒十秒或者十几秒都可以,太长的素材可以用切片机,切片机如果之前视频教程下的切片机不会用,可以用上面懒人包的GUI版。数据集总长度十...
一般不用训练到10000次"learning_rate":0.0004,//学习率,据说应该和bacth_size成比例调整"betas":[0.8,0.99],"eps":1e-9,"batch_size":24,// 每次训练的数据的量,按照显存配置,8gb显存比如1070ti,可以设为6,24gb显存比如3090设为24,这样才能占满显存"fp16_run":false,//是否使用半精度训练,能提升训练...
wav_filename: 待转换的歌曲model_filename: 模型文件名(如G_0.pth)speaker: 原始数据集的文件夹名config_filename: 配置文件名(如config.json) 执行推理后,生成的歌曲文件会在result目录下。 使用体验 山楂在Colab上运行so-vits-svc时,进行了大约800...
1.1 so-vits-svc4.1 源码使用git 拉取源码。通过以下命令:git clone https://github.com/svc-develop-team/so-vits-svc.git1.2 Cuda更新Nvidia显卡驱动至最新 在cmd 控制台里输入 nvidia-smi.exe 以查看显卡驱动版本和对应的 cuda 版本 前往NVIDIA-CUDA 官网下载与系统对应的Cuda 版本 以Cuda-11.7 版本为例,...
3.特征检索模型与聚类模型 考虑到音色还原程度,我更的是使用特征检索模型,该参数0.3和0.5最为合适,过大会导致咬字不清晰。 4. NSF-HIFIGAN增强器 训练数据集较小时开启可以有效提高推理结果的质量,但推理参数对结果影响不大。
so-vits-svc 部署用数据集so-vits-svc 部署用数据集 喜爱 0 实训用 柠 柠栀gardenia 2枚 CC0 智能语音 0 12 2023-07-19 详情 相关项目 评论(0) 创建项目 文件列表 hubert4.0.onnx G_0.pdparams D_0.pdparams yuuka.pdparams nahida.pdparams azi.pdparams hubert4.0.onnx (279.76M) 下载关于...
SO-VITS-SVC 1.提高了数据集成的灵活性:由于实现了基于服务的架构模式,SO-VITS-SVC能够快速适应企业业务发展变化,做到数据集成的灵活性。 2.提高了数据集成的可维护性:SO-VITS-SVC的服务导向架构和虚拟化技术,可以实现多个数据源的数据集成,将数据集中在一个地方进行集成管理,提高了数据集成的可维护性。 3.简化了...
✨ 2024.3.8 最新建议 ✨:目前 GPT-SoVITS 项目的 TTS 与 so-vits-svc 的文字转语音相比,训练集需求量更小,训练速度更快,效果更好,所以此处建议若想使用语音生成功能,请移步 GPT-SoVITS。也因此,建议大家使用歌声素材作为训练集来训练本项目。1