一、本地配置说明 使用的CPU是I5-13600KF 内存32GB 显卡是4070ti 显存12GB 系统版本 Win11 专业工作站版 22H2 二、准备数据集文件 这次使用的数据集是我自己录的干声总时长两小时左右,用Slicer-gui的默认配置切成了每7s一个wav文件 slicer-gui默认配置 ...
本次我们只演示第一种训练方式,即训练现有数据集的原神角色,第二种暂且按下不表。 Bert-VITS2 V2.0.2配置模型 首先克隆项目: git clone https://github.com/v3ucn/Bert-VITS2_V202_Train.git 随后下载新版的bert模型: 链接:https://pan.baidu.com/s/11vLNEVDeP_8YhYIJUjcUeg?pwd=v3uc 下载成功后,解压...
首先出场的是Gradio UI 你需要修改config.yml内的webui块的模型路径和配置文件路径 config.yml路径 这是我的模型和配置文件所在位置,推理所需要的模型只有G开头的G_xxxx.pth device:推理设备 默认cuda是使用gpu进行推理,改为cpu和使用cpu进行推理 model:模型路径 config_path:配置文件路径 我要使用 显卡 并 选择 G...
在这种情况下,你需要确认你使用的版本号是否与你的项目要求相匹配。如果版本号不匹配,可能会导致配置文件中的警告信息出现。为了避免这种情况,请在配置文件中添加正确的版本号,并确保勾选“我没手…”选项以避免误操作。通过以上步骤,你应该已经成功配置并可以使用Bert-vits2-2.3-Final了。这个一键整合包提供了强大的...
本地配置HuggingFace 首先注册HuggingFace平台: https://huggingface.co/join 随后在用户的设置界面新建token,也就是令牌: 这里令牌有两种权限类型,一种是写权限,另外一种是读权限。 随后本地安装Huggingface客户端: pipinstallhuggingface_hub 随后运行命令登录Huggingface账号: ...
配置Bert-vits2中文特化版本 首先克隆项目: gitclonehttps://github.com/v3ucn/Bert-VITS2-Extra_-.git 注意这里是针对官方的Extra分支的修改版本,增加了音频切分和转写。 随后下载新的纯中文底模: https://openi.pcl.ac.cn/Stardust_minus/Bert-VITS2/modelmanage/show_model ...
数字伙伴新增支持网络语音合成功能,即使没有独立显卡也能超快速合成语音,并大大减少内存占用。还支持Bert-VITS2的在线语音合成,语音朗读效果完美超越VITS原版,情感饱满没有口音。于是这里出了这期本地部署simple-vits-api的视频,并配置到数字伙伴上由于临时手头上没有B
最后新建miko/configs/config.json配置文件: {"train": {"log_interval":50,"eval_interval":50,"seed":42,"epochs":1000,"learning_rate":0.0002,"betas": [0.8,0.99],"eps":1e-09,"batch_size":6,"fp16_run":false,"lr_decay":0.99995,"segment_size":16384,"init_lr_ratio":1,"warmup_epoch...
模型配置 首先克隆官方最近的v2.0.2代码: git clone https://github.com/fishaudio/Bert-VITS2.git 随后在项目的根目录创建Data目录 cd Bert-VITS2 mkdir Data 该目录用来存放音色模型文件。 随后下载雷电将军和八重神子的音色模型: 链接:https://pan.baidu.com/s/1e9gKidfvYKLU2IzjoW3sVw?pwd=v3uc ...