启动WebUI在浏览器中访问http://127.0.0.1:7860/,即可在浏览器中使用GPT-SoVITS-WebUI。 使用教程 获取数据集 声音提取:选择 "0a-UVR5人声伴奏分离&去混响去延迟工具" 页签。我们需要勾选 "是否开启UVR5-WebUI" 来提取声音,制作干声。 稍等一下,会打开一个新的WebUI界面。 我们将在这个界面内完成提取干...
勾选是否开启打标WebUI,会打开一个链接:http://localhost:9871/,打开时打标WebUI界面。 这一步可以自己去看看教程。 第三步:开始训练 3.1 将训练的音频格式化点击"1-GPT-SoVITS-TTS"选项,进入训练界面。 训练步骤: 首先,输入模型的名字,不能是中文。 输入文本标注文件路径,默认是D:\GPT-SoVITS-v2-240807\ou...
点击「开启GPT训练」 这两个过程会比较久,等待完成就可以了。 完成后的文件在「GPT_weights」和「SoVITS_weights」文件夹中,把它移动/复制到自己的文件夹中方便管理,云端直接右键下载到本地推理。 推理 点击「1C-推理」 点击「刷新模型路径」 点击「是否开启TTS推理webUI」 之后回到控制台,可以看到新的URL地址,...
到这里,整个声音克隆的准备,微调,合成就已经完成了。GPT-SoVITS的声音克隆,是基于文本转语音的克隆方式,而不是直接改变语音的音色。直接改变音色,我们一般归类为变声,比如我们之前介绍的RVC项目,这个项目类似的功能还在“施工中”可以期待一下。 因为我常年倒腾这些项目,已经练就了一些被动避坑技能。所以在使用这个项目...
conda activate GPTSoVits pip install -r requirements.txt 开始训练 通过以上步骤完成后会直接启动即可,启动完成后跳出网址打开。 如果你的音频没有经过任何处理(人声分离,伴奏分离)请执行第一步[是否开启UVRS-webUi],点击后控制台会出现新的URL链接,复制打开即可,这里不做过多阐述,可以看以前我云端训练的文章。
打开 GPT-SoVITS-v2-240821 文件夹,双击名为go-webui的bat格式文件即可启动服务:服务启动后会弹出一个cmd终端窗口,然后会在浏览器中打开GPT-SoVITS V2的webui网页页面,我们接下来可以在这里制作AI音频,但要注意不要关掉cmd终端窗口,因为它才是服务的本体,网页端只是操作界面。3.简单使用演示 在GPT-SoVITS ...
WebUI 工具:集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注,协助初学者创建训练数据集和 GPT/SoVITS 模型。 训练用整合包下载: https://pan.quark.cn/s/f4a3c5cd3d03 GSVI推理包 2.4.3 链接:https://pan.quark.cn/s/d468bef027ab ...
git clone https://github.com/RVC-Boss/GPT-SoVITS.git 2.启动双击go-webui.bat 访问地址:http://localhost:9874 3.页签【0-前置数据获取工具】中【0a-UVR5人声伴奏分离&去混响去延迟工具】是如果需要分离人声的音频,作者提供了一个工具可以勾选使用,不需要可以跳过 ...
访问WebUI:整合包会自动打开浏览器并访问 http://localhost:9874/。 WebUI界面 完成以上步骤后,您便可以开始愉快地使用GPT-SoVITS-WebUI了。若需要更多帮助,可参考网上的众多使用教程,或访问中文教程文档:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e。