Deleting a branch is permanent. It CANNOT be undone. Continue?
Deleting a branch is permanent. It CANNOT be undone. Continue?
Dear OpenI User
Thank you for your continuous support to the Openl Qizhi Community AI Collaboration Platform. In order to protect your usage rights and ensure network security, we updated the Openl Qizhi Community AI Collaboration Platform Usage Agreement in January 2024. The updated agreement specifies that users are prohibited from using intranet penetration tools. After you click "Agree and continue", you can continue to use our services. Thank you for your cooperation and understanding.
For more agreement content, please refer to the《Openl Qizhi Community AI Collaboration Platform Usage Agreement》
https://openi.pcl.ac.cn/zzc0208/so-vits-svc-npu/src/branch/feat-loguru-4.1-stable/train.py
torch正常安装,尝试了
pip install torch==2.1.0
,提示已安装,pip list
也显示正常运行train.py的时候,图中红框内加载checkpoint的地方能正确加载不报错么。
不能加载,会直接输出
load old checkpoint failed
,但是这两个权重文件在GPU平台上正常工作,不知道是否需要转换成mindspore权重格式权重文件保存时候的torch 版本要和加载时候的torch版本保持一致,这个问题可能是因为,保存torch的权重的时候 版本比较早,现在你是用新版本torch,就会出现这种情况。
但是这两个权重文件在GPU平台上正常工作
你在gpu上面和npu镜像上面使用的torch 版本号一样么?一样的,GPU环境使用的是torch2.1.0版本,能正常加载
你好,
G_0.pth
D_0.pth
预训练底模上传到了https://openi.pcl.ac.cn/zzc0208/so-vits-svc-npu/modelmanage/model_filelist_tmpl?name=so-vits-svc-pretrained如有需要测试本项目,
可以使用https://openi.pcl.ac.cn/zzc0208/so-vits-svc-npu/datasets 中的
data.tar.gz
进行测试,已经预处理完成可以直接在项目目录解压完进行训练为方便调试,也可以使用https://openi.pcl.ac.cn/zzc0208/so-vits-svc-npu/datasets 中的
so-vits-svc-npu.zip
包含了项目所需的vocoder等模型文件经过排查,load时候不能正确加载模型的原因,和你之前的issue 原因一致。#859
在openi平台上使用npu时,会出现导入mindspore后不能正确导入torch的情况,导致加载torch的模型会出现错误,目前原因还在排查。
可以使用规避方案,比如你在本地执行load后,使用save接口,将D 、G两个模型保存为 mindtorch支持格式的pt文件,然后在npu上面直接加载。
经过排查后,pytorch库的导入会引起错误。该错误已知可发生在部分环境下导入第三方库(包括不限于opencv/sklearn)之后再导入torch。https://github.com/pytorch/pytorch/issues/2575
在报错信息中会有类似下面的提示:
可以将so.1.0.0文件预先导入环境变量解决问题,对于当前issue方案为,在terminal中执行命令:
对于其他通用情况,可以查找报错中的so文件位置,并将文件加入环境变量:
收到,感谢
你好,我在使用新疆大学NPU镜像时,貌似不能使用这个解决方案
你得确定一下你的faiss的so文件位置。 我是根据报错信息的提示去找的so文件位置。你得看一下你的报错信息。
在arm linux系统上可能会出现上述问题,需要确定so文件在自己系统中的位置然后使用上面提供的 export 预先导入库的方法来规避,当前问题如无疑问先关闭issue,如果后续有问题另提issue。