近日,Bert-vits2-v2.2如约更新,该新版本v2.2主要把Emotion 模型换用CLAP多模态模型,推理支持输入text prompt提示词和audio prompt提示语音来进行引导风格化合成,让推理音色更具情感特色,并且推出了新的预处理webuI,操作上更加亲民和接地气。 更多情报请参见Bert-vits2官网: https://github.com/fishaudio/Bert-VIT...
底模和使用到的wwm bert现在已可在https://openi.pcl.ac.cn/Stardust_minus/Bert-VITS2/modelmanage/show_model下载。 感谢所有开发者做出的贡献。 Bert-VITS2开发组 敬上 Assets2 DecisionTreee, JusticeRen, shyejun, nekomiya-hinata, fallenangelblog, ricardomlee, MiyazonoKaori137, suzhenghang, Sino-Hua...
vits2 backbone with multilingual-bert. Contribute to officialwwfem/Bert-VITS2 development by creating an account on GitHub.
Bert-vits2项目又更新了,更新了一个新的分支:中文特化,所谓中文特化,即针对中文音色的特殊优化版本,纯中文底模效果百尺竿头更进一步,同时首次引入了大模型,使用国产IDEA-CCNL/Erlangshen-MegatronBert-1.3B大模型作为Bert特征提取,基本上完全解决了发音的bad case,同时在情感表达方面有大幅提升,可以作为先前V1.0.1纯...
近日,Bert-vits2-v2.2如约更新,该新版本v2.2主要把Emotion 模型换用CLAP多模态模型,推理支持输入text prompt提示词和audio prompt提示语音来进行引导风格化合成,让推理音色更具情感特色,并且推出了新的预处理webuI,操作上更加亲民和接地气。 更多情报请参见Bert-vits2官网: ...
Bert-vits2项目又更新了,更新了一个新的分支:中文特化,所谓中文特化,即针对中文音色的特殊优化版本,纯中文底模效果百尺竿头更进一步,同时首次引入了大模型,使用国产IDEA-CCNL/Erlangshen-MegatronBert-1.3B大模型作为Bert特征提取,基本上完全解决了发音的bad case,同时在情感表达方面有大幅提升,可以作为先前V1.0.1纯...
近日,Bert-vits2发布了最新的版本2.3-final,意为最终版,修复了一些已知的bug,添加基于 WavLM 的 Discriminator(来源于 StyleTTS2),令人意外的是,因情感控制效果不佳,去除了 CLAP情感模型,换成了相对简单的 BERT 融合语义方式。 事实上,经过2.2版本的测试,CLAP情感模型的效果还是不错的,关于2.2版本,请移步: ...
https://openi.pcl.ac.cn/Stardust_minus/Bert-VITS2/modelmanage/show_model ``` 本项目采取《Bert-VITS2_2.3底模》。 将模型文件放在: ``` ./A1_pretrained_models/Bert-VITS2_2.3 # 文件目录结构如下 A1_pretrained_models/Bert-VITS2_2.3
近日,Bert-vits2发布了最新的版本2.3-final,意为最终版,修复了一些已知的bug,添加基于 WavLM 的 Discriminator(来源于 StyleTTS2),令人意外的是,因情感控制效果不佳,去除了 CLAP情感模型,换成了相对简单的 BERT 融合语义方式。 事实上,经过2.2版本的测试,CLAP情感模型的效果还是不错的,关于2.2版本,请移步: ...
将白嫖进行到底!!!Bert-VITS2一键克隆声音Notebook更新了,这次不光支持训练数据保存、恢复,还优化了模型下载,并且还增加了ONNX模型导出(虽然没啥用)。再也不用担心免费额度用完了,第二天也能轻轻松松继续训练,或者推理!快来试试吧!视频中的Notebook地址: https