黄世宇 huangsy13

OpenRL是一个开源的通用强化学习框架,支持单、多智能体,自博弈,离线强化学习,大语言模型训练。

Updated 1 year ago Python