2024年澳门天天开好彩最新版,本地训练推理可以参考下面的视频和专栏:Q1:训练需要多少/多长的音频素材?A:数据集的数量和 长度都没有特别硬性的要求,每条长度五秒十秒或者十几秒都可以,太长的素材可以用切片机,切片机如果之前视频教程下的切片机不会用,可以用上面懒人包的GUI版。数据集总长度十几分钟,几十分钟一两个小时都不是不可以,不过数据集量太少可能影响训练效果,所以可能的话推荐准备一两个小时的数据集,不过不建议复制音频填充数量,那样训练集会比较单一。Q2:为什么我准备的数据集按照视频解压/重采

本地训练推理可以参考下面的视频和专栏:



Q1:训练需要多少/多长的音频素材?

A:数据集的数量和 长度都没有特别硬性的要求,每条长度五秒十秒或者十几秒都可以,太长的素材可以用切片机,切片机如果之前视频教程下的切片机不会用,可以用上面懒人包的GUI版。数据集总长度十几分钟,几十分钟一两个小时都不是不可以,不过数据集量太少可能影响训练效果,所以可能的话推荐准备一两个小时的数据集,不过不建议复制音频填充数量,那样训练集会比较单一。

Q2:为什么我准备的数据集按照视频解压/重采样失败了?

A:首先检查你执行指令的终端是否在数据集文件所在文件夹下,例如当你的压缩文件在dataset_raw文件夹下时,务必保证终端输入时, :之后#之前有dataset_raw的字样,如下图。

压缩文件在其他文件夹下时依此类推。如果不在对应文件夹下,请在该文件夹下重新打开终端,或者熟悉linux操作可以cd移动过去。

其次,执行unzip指令请保证你的压缩文件是zip格式,改文件后缀为zip并不能把rar文件改成zip格式,请压缩成zip格式。

最后请保证你的训练集是wav格式,改文件后缀为wav并不能把mp3文件改成wav格式,请自己找格式工厂之类的音频格式转换软件。

另外,文件名包含一些特殊符号有可能导致后续步骤出错,保险起见建议文件名改为纯英文数字的形式,数据集量较大请自行百度文件名批量修改的方法。

Q5:其他问题报错。

A:线上平台使用镜像按照正常流程来理论上是不会有问题的,如果出现什么奇怪的报错,一般是某一个步骤没有按照流程来,或者没有等之前的步骤执行完就着急执行了下一步之类的,如果自己都没注意到之前哪里做的和教程不一样,那这种情况很难定位问题原因,总之一律建议重置一下镜像从头开始严格按照流程再尝试一遍。

Q6:为什么我执行开始训练没有开始训练?

A:如果是在终端执行代码开始训练,同Q2,先检查终端是否在so-vits-svc的项目文件夹下,不在的话请在项目文件夹下打开终端或者cd过去,再检查执行的指令前面带没带感叹号,如果带了感叹号请将感叹号去掉。

如果在readme文档中执行开始训练,首先不推荐你在这儿执行开始训练,你如果一意孤行的话,那你检查下执行的指令前面带没带感叹号,如果没带感叹号请加一个英文感叹号。

Q7:我ctrl+c中止训练了,怎么重新开始训练?

A:按照开始训练的正常流程,重新执行开始训练的代码。

Q8:我空间不够了,可以扩容吗/可以删掉之前比较早的版本的模型吗?

A:可以。

Q9:我之前训练停了,为什么继续训练又从头开始了?

A:首先,改一下config文件,把epochs改大点试试。如果是盘满了停了的话,有可能你最后保存的模型因为空间不够的原因保存的是损坏的模型,没法读取进度继续训练,把最后生成的模型删掉保留倒数第二个再试试。

Q10:多久保存一个模型/多久一个epoch是正常的?

A:跟你数据集的量有关系,多久都是正常的。
香港最准100%一肖中特特色

Q11:我Epoch后面一直是0%是不是有问题?

A:不是,那玩意不是进度,不用管它。

Q12:我租的显卡在训练,自己的电脑可不可以关机/网页可不可以关掉?

A:可以,你甚至换电脑都行,你租的实例相当于租了台电脑主机,开个网页相当于连了下你自己的显示器,你把显示器关了主机该干什么肯定还在干什么。

Q13:我租配置和我自己的电脑配置有没有关系?

A:没有。

Q14:我关机/中止训练会不会丢失进度?

A:关机不会删除你实例的内容,释放实例才会,只要实例不主动释放或者三十天自动释放,在里面原来有什么就还会有什么。你保存的模型可以理解为训练进度保存的存档,只要保存了模型就保存下进度了,相应的,你中止训练的时候,上一个保存的模型之后的训练进度都是没有保存的,可以理解为丢失少部分进度,那点进度基本不用在乎,重新开始都是接着最后的进度继续的,分分钟就补回来了。

Q15:一般训练多少个Epoch/多长时间效果会好?

A:没有这种标准,也是跟你数据集的情况有关系。训练过程中的那些losses可以看作是评估的数值,简单点说那五个数都是数字越小越好,如果数字开始不怎么继续往下降了,甚至开始反复横跳了,那基本上训练能达到的效果就到这儿了。

你也可以每隔一段时间就停一下训练,然后实际推理听听效果,如果你自己感觉训练出的模型已经满足预期了也不用再继续了。

Q16:训练报错了怎么办?

A:首先找报错信息,一般最下面几行会有XXXXXErrorXXXX之类的内容,如下图。

OutOfMemoryError:CUDA out of memory这种就是最常见的,俗称炸显存或者爆显存,一般是你batch_size太大了,改小就能解决,还不行就再改小,直到行了为止(如果是之前开始训练正常,重新开始训练出问题,可能你之前根本没关闭训练,后台依然在占用性能,解决方案参考下面三板斧第一板斧)。

如果是其他报错,一样,先到底下找Error这几个字母,把那一行复制下来去百度,各种各样的问题一般肯定都有其他人遇到过,并且成功解决的人会网络上会分享出解决方案和心得,按照各路大佬的方案走一遍基本都能解决。有人遇到各种我没见过的问题来问我,我基本也是走百度搜解决方案这个路子,有一定解决问题的能力也没必要经过我这个中间商了。

如果说你不具备问题排错的基础知识或者能力,那可以按照我下面的三板斧走一遍:

第一,关内核重新来一遍。网页左下角那个终端和芯片的按键,点进去,把所有终端和内核都关掉,重新开新的终端再执行一遍(适用于各种后台占用性能或者推理加载的问题)。

第二,如果还是不管用,退出JupyterLab,关机,重置镜像,再开机,再试试(适用于各种不小心动了依赖环境导致的问题)。

第三,还是不行的话,原来这个实例关机释放了吧,重新租一张别的型号的显卡,比如A5000、3090之类的,再试试(适用于各种显卡型号,cuda版本导致的问题)。

俗话说得好,重启解决百分之九十,重装系统解决百分之九十九,换电脑解决百分之百。这三板斧下去,操作再都正确的话,基本上绝大部分的问题都能解决。

Q17:训练好的模型怎么下载到我的电脑上?

A:右键下载,或者移动到网盘文件夹后台网盘下载,但是不太建议这么干,出问题找我的人里面十个有六个是因为模型拿到别的地方用出的各种问题,建议是在哪训练在哪推理。


Q18:报错了怎么办?

A:炸显存的话把推理音频剪短,其他绝大部分关内核重新加载模型,耐心等加载完就能解决,剩下的大部分检查下参数路径文件名对不对,不对的改过来也能解决,再剩下的转一下wav文件类型,改一下文件后缀wav的大小写基本也能解决。

其他问题,同Q16,直接百度,或者走三板斧。

Q19:推理出来效果不好怎么办?

A:多换几个别的模型再试试(用G开头的模型,不要用D开头的,D模型是用来验证G模型的),多换几首歌再试试,控制变量排除一下,定位问题在哪。

如果是推理的那首歌的问题,那就找干声更清晰的歌推理,或者去找音频处理教程看看有没有解决杂音和声之类问题的方法。

如果是训练出来的模型都不行,那建议重新筛选一下数据集,从头开始重新训练试试。

Q20:推理出来速度变快/慢了怎么办?

A:一般是采样率的问题,在哪训练直接就地推理一般不会出现这样的问题,如果我的镜像变速了,就换4.0webUI里面的32k3.0版本项目再试试,反之亦然,一般找不同版本的项目多试试总能找到一个不会变速的位置。

好像也有推理音频的采样率没对上导致出这个问题的情况,不过我没遇到过,如果试了几次都不行,要不再试试把推理的音频重新采样一下。

Q21:我从别的地方拿来的模型为什么不能用?

A:首先,可能你拿的模型不是so-vits项目的模型,其次,可能模型训练的项目版本和镜像的版本不一致。如果检查文件名路径之类的都没有错误,就是推理不出来,建议直接放弃,自己训练模型自己用。


评论列表

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。