Are you sure you want to delete this task? Once this task is deleted, it cannot be recovered.
liuzx 924d6458f5 | 2 years ago | |
---|---|---|
Example_picture | 2 years ago | |
README.md | 2 years ago | |
model.py | 2 years ago | |
train.py | 2 years ago |
使用GPU进行训练,需要在GPU芯片上运行,所以上传的数据集需要传到GPU界面。(此步骤在本示例中不需要,可直接选择公开数据集MNISTDataset_torch.zip)
准备好数据和执行脚本以后,需要创建训练任务将Pytorch脚本运行。首次使用的用户可参考本示例代码。
由于A100的适配性问题,A100需要使用cuda11以上的cuda版本,目前平台已提供基于A100的cuda基础镜像,只需要选择对应的公共镜像:
训练界面参数参考如下:
表1 创建训练作业界面参数说明
参数名称 | 说明 |
---|---|
计算资源 | 选择CPU/GPU |
代码分支 | 选择仓库代码中要使用的代码分支,默认可选择master分支 |
镜像 | 镜像选择已在调试环境中调试好的镜像,目前版本请选择基础镜像:平台提供基于A100的cuda基础镜像,如dockerhub.pcl.ac.cn:5000/user-images/openi:cuda111_python37_pytorch191 |
启动文件 | 启动文件选择代码目录下的启动脚本train.py |
数据集 | 数据集选择已上传到启智平台的公共数据集MnistDataset_torch.zip |
运行参数 | 增加运行参数可以向脚本中其他参数传值,如epoch_size |
资源规格 | 规格选择含有GPU个数的规格 |
目前训练任务的日志只能在代码中print输出,参考示例train.py代码相关print
Dear OpenI User
Thank you for your continuous support to the Openl Qizhi Community AI Collaboration Platform. In order to protect your usage rights and ensure network security, we updated the Openl Qizhi Community AI Collaboration Platform Usage Agreement in January 2024. The updated agreement specifies that users are prohibited from using intranet penetration tools. After you click "Agree and continue", you can continue to use our services. Thank you for your cooperation and understanding.
For more agreement content, please refer to the《Openl Qizhi Community AI Collaboration Platform Usage Agreement》