Q_learning

关于GCU、沐曦GPGPU、MLU、0卡V100资源4月7日恢复上架的公告>>> 关于共建具身智能开源数据集的倡议>>> 关于云脑任务中统一路径访问方式的公告>>> 关于将启智集群GPU资源迁移至智算集群的公告>>>

Edwina____ f0f0d8e5ff 上传文件至 'environments'		1 year ago
agents	上传文件至 'agents'	1 year ago

assets	上传文件至 'assets'	1 year ago

environments	上传文件至 'environments'	1 year ago

networks	上传文件至 'networks'	1 year ago

LICENSE	上传文件至 ''	1 year ago

README.md	上传文件至 ''	1 year ago

README_eng.md	上传文件至 ''	1 year ago

main.py	上传文件至 ''	1 year ago

test.sh	上传文件至 ''	1 year ago

utils.py	上传文件至 ''	1 year ago

20.2.1 安装依赖库

pip install gym[all] scipy tqdm

20.2.2 训练

使用GPU训练：

python main.py --network_header_type=nips --env_name=Breakout-v0 --use_gpu=True

使用CPU训练：

python main.py --network_header_type=nips --env_name=Breakout-v0 --use_gpu=False

打开TensorBoard：

tensorboard --logdir logs/

20.2.3 测试

测试在GPU上训练的模型：

python main.py --network_header_type=nips --env_name=Breakout-v0 --use_gpu=True --is_train=False

测试在CPU上训练的模型：

python main.py --network_header_type=nips --env_name=Breakout-v0 --use_gpu=True --is_train=True

在上述命令中加入--display=True选项，可以实时显示游戏进程。

本章主要介绍了深度强化学习算法DQN，关于该算法的更多细节，可以参考论文Playing Atari with Deep Reinforcement Learning。
本章还介绍了OpenAI 的gym 库，它可以为我们提供常用的强化学习环境。读者可以参考它的文档https://gym.openai.com/docs/ 了解 gym 库的使用细节，此外还可以在https://gym.openai.com/envs/ 看到当前Gym 库支持的所有环境。

强化学习项目

Python Markdown Shell