wuzb1005/PARL: PARL 是一个高性能、灵活的强化学习框架 - papers/ICLR_2020.md at develop - PARL - OpenI

关于GCU、沐曦GPGPU、MLU、0卡V100资源4月7日恢复上架的公告>>> 关于共建具身智能开源数据集的倡议>>> 关于云脑任务中统一路径访问方式的公告>>> 关于将启智集群GPU资源迁移至智算集群的公告>>>

CAUSAL DISCOVERY WITH REINFORCEMENT LEARNING ICLR 2020. paper

Shengyu Zhu, Ignavier Ng, Zhitang Chen
Posterior sampling for multi-agent reinforcement learning: solving extensive games with imperfect informatio ICLR 2020. paper

Yichi Zhou , Jialian Li, Jun Zhu
Harnessing Structures for Value-Based Planning and Reinforcement Learning ICLR2020. paper

Yuzhe Yang , Guo Zhang, Zhi Xu, Dina Katabi
A Closer Look at Deep Policy Gradients ICLR 2020. paper

Andrew Ilyas, Logan Engstrom, Shibani Santurkar, Dimitris Tsipras, Firdaus Janoos, Larry Rudolph, Aleksander Madry
Implementation Matters in Deep RL: A Case Study on PPO and TRPO ICLR 2020. paper

Logan Engstrom, Andrew Ilyas, Shibani Santurkar, Dimitris Tsipras, Firdaus Janoos, Larry Rudolph, Aleksander Madry
A Generalized Training Approach for Multiagent Learning ICLR 2020. paper

Paul Muller, Shayegan Omidshafiei, Mark Rowland, Karl Tuyls, Julien Perolat, Siqi Liu, Daniel Hennes, Luke Marris, Marc Lanctot, Edward Hughes, Zhe Wang, Guy Lever, Nicolas Heess, Thore Graepel, Remi Munos
Meta-Q-Learning ICLR 2020. paper

Rasool Fakoor, Pratik Chaudhari, Stefano Soatto, Alexander J. Smola
SEED RL: Scalable and Efficient Deep-RL with Accelerated Central Inference ICLR 2020. paper

Lasse Espeholt, Raphaël Marinier, Piotr Stanczyk, Ke Wang, Marcin Michalski