小白训练营第8课-云脑(基于Ascend NPU调试和训练任务)
如何使用云脑2调试和训练任务
前一节课我们讲解了云脑1的功能,本节课我们一起来学习云脑2。
虽然云脑2与云脑1一样具有调试任务的功能,但在操作方面存在很大区别,同时云脑2还具备训练任务的功能,我们一起来看看吧~
Part1-调试任务
1. 上传数据集
要使用云脑,需先上传数据集,我们先点击【数据集】页面,选择【Ascend NPU】,将备用的数据集直接拖入到上传框
云脑1和云脑2数据集无法共用,所以调试使用的数据集也应上传到对应的环境,否则调试任务无法创建成功
2. 新建调试任务
点击【云脑】页面,点击右侧按钮【新建调试任务】
3. 完成新建任务
在新建任务的页面中,计算资源选择【Ascend NPU】,数据集选择该项目调试相关的数据集,然后点击【新建任务】完成创建
注:同一账号在1个或多个项目间,只能同时并发一个训练任务,如有多个训练任务则需要等待相应任务停止才能创建额外的任务,否则会导致任务创建失败。
稍等十秒左右,待状态由CREATING变为RUNNING后,点击右侧操作栏的【调试】
4. 同步数据到OBS
点击【调试】后,跳转至Jupyter环境界面,其中:
【Files】显示该项目内所有代码文件及数据集
【Running】显示所有正在运行的代码文件
点击顶部右侧按钮【Open JupyterLab】按钮可直接进入JupyterLab调试环境
右侧【Upload】可上传文件,【New】可创建新的文件
选择相应文件后,可进行同步到OBS,复制,重命名,移动,下载,预览,编辑及删除等操作。
比如,选择数据集,点击【Sync OBS】将数据集同步到OBS,页面弹出确认框,点击【YES】后待提示成功,关闭窗口即可。
5. 创建代码文件
点击右侧【New】,在弹出的窗口中根据自身项目需求及算法框架,选择想要创建的代码文件,比如这里选择以MindSpore为框架的Notebook
6. 代码调试
选择文件后,自动跳转到代码调试环境,可根据项目实际情况输入相关代码进行调试啦~
比如,我们输入!unzip +数据集名称,即可解压数据集
好啦~云脑2的调试任务功能就讲解到这里啦,大家可以上传自己的项目多体验,接下来我们一起来学习云脑2的训练任务功能。
Part2-训练任务
1. 创建训练任务
在【云脑】主界面,点击左侧【训练任务】,进入到训练任务的管理页面
点击右侧【新建训练任务】,进入任务创建页面,其中【启动文件】和【数据集】为必填项,需选择该项目相关的文件,且启动文件必须为.py格式的文件(可以点击右侧的查看样例了解如何进行模型训练的详情),所以需先上传代码文件,因前面已经上传过数据集,此处也不再赘述,其他选项默认即可
2. 训练任务
点击新建任务后,待状态由INIT变更为RUNNING后(由于需要申请算力资源,此过程可能会持续一定时间,稍候即可),项目将开始启动训练
3. 查看配置信息
点击任务名称,进入到版本管理页面,默认查看配置信息,比如任务运行时长及状态,还有相关参数信息等
4. 查看训练日志
点击配置信息旁边选项【日志】可以查看相关训练日志,尤其当训练任务失败时,状态会显示为“FAILED”,此时我们可以通过查询日志了解训练失败的原因
好啦~本节课关于云脑2的功能讲解到这里啦,大家也可以参考第13课 -CIFAR-10图像识别项目实战了解更多云脑的相关操作,大家记得多体验练习哦~