9.5 KiB

Raw Permalink Blame History

目录
- 概述
- 论文
模型架构
数据集
环境要求
快速入门
脚本说明
- 脚本结构与说明
脚本参数
训练过程
- 用法
  - Ascend处理器环境运行
- 结果
评估过程
- 用法
  - Ascend处理器环境运行
- 结果
推理过程
模型描述
- 性能
  - 评估性能
随机情况说明
ModelZoo主页

GhostNet描述

概述

GhostNet由华为诺亚方舟实验室在2020年提出，此网络提供了一个全新的Ghost模块，旨在通过廉价操作生成更多的特征图。基于一组原始的特征图，作者应用一系列线性变换，以很小的代价生成许多能从原始特征发掘所需信息的“幻影”特征图（Ghost feature maps）。该Ghost模块即插即用，通过堆叠Ghost模块得出Ghost bottleneck，进而搭建轻量级神经网络——GhostNet。该架构可以在同样精度下，速度和计算量均少于SOTA算法。

如下为MindSpore使用ImageNet2012数据集对GhostNet进行训练的示例。

论文

论文: Kai Han, Yunhe Wang, Qi Tian."GhostNet: More Features From Cheap Operations"

模型架构

GhostNet的总体网络架构如下：链接

数据集

使用的数据集：ImageNet2012

数据集大小：共1000个类、224*224彩色图像
- 训练集：共1,281,167张图像
- 测试集：共50,000张图像
数据格式：JPEG
- 注：数据在dataset.py中处理。
下载数据集，目录结构如下：

└─dataset
    ├─ilsvrc                  # 训练数据集
    └─validation_preprocess   # 评估数据集

环境要求

硬件
- 准备Ascend处理器搭建硬件环境。
框架
- MindSpore
如需查看详情，请参见如下资源：
- MindSpore教程
- MindSpore Python API

快速入门

通过官方网站安装MindSpore后，您可以按照如下步骤进行训练和评估：

Ascend处理器环境运行

# 分布式训练
用法：sh run_distribute_train.sh [RANK_TABLE_FILE] [DATASET_PATH] [PRETRAINED_CKPT_PATH]（可选）

# 单机训练
用法：sh run_standalone_train.sh [DATASET_PATH] [PRETRAINED_CKPT_PATH]（可选）

# 运行评估示例
用法：sh run_eval.sh [DATASET_PATH] [CHECKPOINT_PATH]

脚本说明

脚本结构与说明

└──ghostnet
  ├── README.md
  ├── ascend310_infer                      # ascend310推理
    ├── inc
      └──  utils.h                         # ascend310推理
    ├── src
      ├── build.sh                         # ascend310推理
      ├── CMakeLists.txt                   # ascend310推理
      ├── main.cc                          # ascend310推理
      └──  utils.cc                        # ascend310推理
    ├── scripts
      ├── run_distribute_train.sh          # 启动Ascend分布式训练（8卡）
      ├── run_eval.sh                      # 启动Ascend评估
      ├── run_infer_310.sh                 # 启动Ascend310推理
      └── run_standalone_train.sh          # 启动Ascend单机训练（单卡）
  ├── src
    ├── config.py                          # 参数配置
    ├── dataset.py                         # 数据预处理
    ├── CrossEntropySmooth.py              # ImageNet2012数据集的损失定义
    ├── lr_generator.py                    # 生成每个步骤的学习率
    ├── ghostnet600.py
    ├── launch.py
    └── ghostnet.py                        # ghostnet网络
  ├── eval.py                              # 评估网络
  ├── create_imagenet2012_label.py         # 创建ImageNet2012标签
  ├── export.py                            # 导出MindIR模型
  ├── postprocess.py                       # 310推理的后期处理
  ├── requirements.txt                     # 需求文件
  └── train.py                             # 训练网络

脚本参数

在config.py中可以同时配置训练参数和评估参数。

配置GhostNet和ImageNet2012数据集。

"num_classes": 1000,           # 数据集类数
"batch_size": 128,             # 输入张量的批次大小
"epoch_size": 500,             # 训练周期大小
"warmup_epochs": 20,           # 热身周期数
"lr_init": 0.1,                # 基础学习率
"lr_max": 0.4,                 # 最大学习率
'lr_end': 1e-6,                # 最终学习率
'lr_decay_mode': 'cosine',     # 用于生成学习率的衰减模式
"momentum": 0.9,               # 动量优化器
"weight_decay": 4e-5,          # 权重衰减
"label_smooth": 0.1,           # 标签平滑因子
"loss_scale": 128,             # 损失等级
"use_label_smooth": True,      # 标签平滑
"label_smooth_factor": 0.1,    # 标签平滑因子
"save_checkpoint": True,       # 是否保存检查点
"save_checkpoint_epochs": 20,  # 两个检查点之间的周期间隔；默认情况下，最后一个检查点将在最后一个周期完成后保存
"keep_checkpoint_max": 10,     # 只保存最后一个keep_checkpoint_max检查点
"save_checkpoint_path": "./",  # 检查点相对于执行路径的保存路径

训练过程

用法

Ascend处理器环境运行

# 分布式训练
用法:sh run_distribute_train.sh [RANK_TABLE_FILE] [DATASET_PATH] [PRETRAINED_CKPT_PATH]（可选）

# 单机训练
用法:sh run_standalone_train.sh [DATASET_PATH] [PRETRAINED_CKPT_PATH]（可选）

分布式训练需要提前创建JSON格式的HCCL配置文件。

具体操作，参见hccn_tools中的说明。

训练结果保存在示例路径中，文件夹名称以“train”或“train_parallel”开头。您可在此路径下的日志中找到检查点文件以及结果，如下所示。

结果

使用ImageNet2012数据集训练GhostNet

# 分布式训练结果（8P）
epoch: 1 step: 1251, loss is 5.001419
epoch time: 457012.100 ms, per step time: 365.317 ms
epoch: 2 step: 1251, loss is 4.275552
epoch time: 280175.784 ms, per step time: 223.961 ms
epoch: 3 step: 1251, loss is 4.0788813
epoch time: 280134.943 ms, per step time: 223.929 ms
epoch: 4 step: 1251, loss is 4.0310946
epoch time: 280161.342 ms, per step time: 223.950 ms
epoch: 5 step: 1251, loss is 3.7326777
epoch time: 280178.602 ms, per step time: 223.964 ms
...

评估过程

用法

Ascend处理器环境运行

# 评估
Usage: sh run_eval.sh [DATASET_PATH] [CHECKPOINT_PATH]

# 评估示例
sh  run_eval.sh  /data/dataset/ImageNet/imagenet_original  ghostnet-500_1251.ckpt

训练过程中可以生成检查点。

结果

评估结果保存在示例路径中，文件夹名为“eval”。您可在此路径下的日志找到如下结果：

使用ImageNet2012数据集评估GhostNet

result: {'top_5_accuracy': 0.9162371134020618, 'top_1_accuracy': 0.739368556701031}
ckpt = /home/lzu/ghost_Mindspore/scripts/device0/ghostnet-500_1251.ckpt

推理过程

导出MindIR

python export.py --ckpt_file [CKPT_PATH] --file_name [FILE_NAME] --file_format [FILE_FORMAT]

参数ckpt_file为必填项，
FILE_FORMAT 必须在 ["AIR", "MINDIR"]中选择。

在Ascend310执行推理

在执行推理前， mindir文件必须通过export.py脚本导出。以下展示了使用mindir模型执行推理的示例。目前仅支持batch_Size为1的推理。

bash run_infer_310.sh [MINDIR_PATH] [DATA_PATH] [DEVICE_ID]

DEVICE_ID 可选，默认值为0。

结果

推理结果保存在脚本执行的当前路径，你可以在acc.log中看到以下精度计算结果。

使用ImageNet2012数据集评估ghostnet

Total data: 50000, top1 accuracy: 0.73816, top5 accuracy: 0.9178.

模型描述

性能

评估性能

参数	Ascend 910
模型版本	GhostNet
资源	Ascend 910；CPU：2.60GHz，192核；内存：755G
上传日期	2021-06-22 ;
MindSpore版本	1.2.0
数据集	ImageNet2012
训练参数	epoch=500, steps per epoch=1251, batch_size = 128
优化器	Momentum
损失函数	Softmax交叉熵
输出	概率
损失	1.7887309
速度	223.92毫秒/步（8卡）
总时长	39小时
参数(M)	5.18
微调检查点	42.05M（.ckpt文件）
脚本	链接

随机情况说明

dataset.py中设置了“create_dataset”函数内的种子，同时还使用了train.py中的随机种子。

ModelZoo主页

请浏览官网主页。

9.5 KiB Raw Permalink Blame History

目录

GhostNet描述

概述

论文

模型架构

数据集

环境要求

快速入门

脚本说明

脚本结构与说明

脚本参数

训练过程

用法

Ascend处理器环境运行

结果

评估过程

用法

Ascend处理器环境运行

结果

推理过程

导出MindIR

在Ascend310执行推理

结果

模型描述

性能

评估性能

随机情况说明

ModelZoo主页

9.5 KiB

Raw Permalink Blame History