折腾了几天发现在Linux下训练速度确实要比win更快(同样的svc版本4.0V1和训练集,batch_size:6,win大约是80s一个epoch,Linux是60s一个epoch),而且配置环境也更省心,但是中间还是有一些坑,所以写了这篇教程,希望能帮助大家节约折腾的时间 本文的目的是让没接触过Linux也能顺利完成安装so-vits-svc,并且可以最快用上...
2.1、安装conda 地址:https://docs.conda.io/projects/miniconda/en/latest/,下载对应版本,Linux版本为一个sh文件 sh Miniconda3-latest-Linux-x86_64 然后将conda加入到PATH 2.2、在so-vits-svc目录下,激活conda环境 conda activate 2.3、安装依赖,非常顺利 pip install -r requirements.txt 3、 下载预训练模型 ...
Q: A卡真的跑不了吗哭哭 A: 理论上可以在Ubuntu或Linux环境下通过ROCm来实现,但是比较麻烦,小白建议放弃直接去云端。 Q: 我的显卡达不到最低要求,云端又心疼钱,真的没法训练了吗? A: 建议去看DDSP-SVC项目(BV1qM411W7ft),效果差一点但也能听,最重要的是对低配非常友好。 Q: 用UVR5分离人声的时候...
接着安装依赖,如果是Linux或者Mac系统,运行命令: pip install -r requirements.txt 如果是Windows用户,需要使用Win系统专用的依赖文件 pip install -r requirements_win.txt 依赖库安装成功之后,在项目的根目录运行命令,启动服务: python webUI.py 程序返回: PS D:\so-vits-svc> python .\webUI.py DEBUG:charse...
修复Mac、Linux "shell=True" 导致的报错,Win去除这个也会报错4.0 (svc-develop-team/so-vits-svc#147) limbang committed Apr 12, 2023 Verified 1 parent 3438222 commit 4ce60dc Showing 1 changed file with 5 additions and 5 deletions. Whitespace Ignore whitespace Split Unified 10 changes: 5 addi...
Linux/MacOS: python3.10 -m venv venv source venv/bin/activate Anaconda: conda create -n so-vits-svc-fork python=3.10 pip conda activate so-vits-svc-fork 如果Python 安装在 Program Files,在安装时未创造虚拟环境可能会导致PermissionError 安装 通过pip 安装 (或者通过包管理器使用 pip 安装): python...
pip install --user /home/aistudio/work/torch-1.10.0+cu111-cp37-cp37m-linux_x86_64.whl Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple Processing ./work/torch-1.10.0+cu111-cp37-cp37m-linux_x86_64.whl Requirement already satisfied: typing-extensions in /opt/conda/envs/...
05.linux常用操作 解压数据集 数据集通过网盘上传,下载到实例的数据盘里 unzip file.zip 分卷压缩的情况,网上说的zip -F 我没执行成功过 可以直接 cat filename.z* > newfile.zip unzip newfile.zip powershell安装 linux的命令不是很会,安装powershell(至少自带的命令补全比bash方便),这样就比较习惯了。
4. **云端训练**请**首选Linux**系统镜像,**不推荐**云端使用Windows系统进行训练 ### 0.2 提前准备 1. **至少**准备200条8s(约30分钟**持续说话**时长,即约1.5小时**正常说话**采样)左右时长的**干净**人声(**无底噪,无混响**)作为训练集。并且最好保持说话者**情绪起伏波动较小**,人声**响度...
4. **云端训练**请**首选Linux**系统镜像,**不推荐**云端使用Windows系统进行训练 ### 0.2 提前准备 1. **至少**准备200条8s(约30分钟**持续说话**时长,即约1.5小时**正常说话**采样)左右时长的**干净**人声(**无底噪,无混响**)作为训练集。并且最好保持说话者**情绪起伏波动较小**,人声**响度...