双击so-vits-svc文件夹里的启动webui.bat,会弹出一个网页。 选择模型文件。 需要选择主模型、主模型配置文件、扩散模型和扩散模型配置文件。 模型文件有的放了步数不同的两个,效果可能略微不同,请多多尝试。 点击加载模型文件夹复制位置正确的话So-vits 说话人位置会出现歌手名。 把准备好的干音拖进框框。 选择...
在浏览器中输入127.0.0.1:7860,可以打开WebUI: (1)加载模型 首先导入模型文件,模型文件所在位置:.\so-vits-svc\logs\44k\G_xxxx.pth 然后导入配置文件,配置文件所在位置:.\so-vits-svc\configs\config.json 导入这两个文件后,加载模型,如果成功加载,可以得到音色名称: (2)导入歌曲并替换音色 将刚才准备的干净...
so-vits-svc仓库: https://github.com/svc-develop-team/so-vits-svc 艾伦·耶格尔声音模型下载链接: 奶牛快传:https://cowtransfer.com/s/afc512a8f1a342 口令:se54bo 解压后获得模型文件G_12800.pth和配置文件config.json 解压后将这两个文件放入so-vits-svc4.0的目录/logs/44k中,将speaker名称指定为eren...
so-vits-svc是基于VITS的开源项目,VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)是一种结合变分推理(variational inference)、标准化流(normalizing flows)和对抗训练的高表现力语音合成模型 不过千万别被chatgpt骗了,生生把一个语言模型说成图像分类模型(version:3.5) gpt版本...
so-vits-svc4.0是一个功能强大的语音克隆项目,它基于先进的深度学习技术,实现了声音的高保真转换和克隆。本文将从环境搭建、依赖安装、数据预处理、模型训练与推理等方面,为用户提供一份详尽的使用教程。 一、项目环境搭建 创建Anaconda环境: 打开Anaconda Prompt,新建一个名为so-vits-svc的环境,并指定Python版本为3.8...
wav_filename: 待转换的歌曲model_filename: 模型文件名(如G_0.pth)speaker: 原始数据集的文件夹名config_filename: 配置文件名(如config.json) 执行推理后,生成的歌曲文件会在result目录下。 使用体验 山楂在Colab上运行so-vits-svc时,进行了大约800...
So-VITS-SVC:SoftVC VITS Singing Voice Conversion SoftVC,编码技术,用soft聚类来消除说话人的音色特征 VITS,核心技术 Singing Voice Conversion,使用场景 整体架构 和VITS的差别是, VITS是从文本到声音,文本的编码长度和声音的不一样的,所以需要时长预测,强制匹配复制 ...
pip install -U so-vits-svc-fork 也可以到release页面下载whl pip install -r whlname.whl 有一个问题是自带的华为云镜像比较旧很多包没有,这一步我也折腾了挺久 我建议pip和conda换成清华的镜像 我后来才发现autodl有换镜像的操作,在autopanel上就能换,比较方便。
git clone https://github.com/svc-develop-team/so-vits-svc.git1.2 Cuda更新Nvidia显卡驱动至最新 在cmd 控制台里输入 nvidia-smi.exe 以查看显卡驱动版本和对应的 cuda 版本 前往NVIDIA-CUDA 官网下载与系统对应的Cuda 版本 以Cuda-11.7 版本为例,根据自己的系统和需求选择安装(一般本地 Windows 用户请依次...