基于Ray 的分布式强化学习框架,Ray 是一个面向大规模机器学习和增强学习应用的高性能分布式执行框架。业级的强化学习库,优势在于分布式计算和自动调参,支持 TensorFlow/PyTorch,很多大企业比如谷歌、亚马逊、蚂蚁金服都在用。该框架社区活跃、开源代码更新频繁。 但是这个库太通用了,上手比较困难,它使用的是自己的分布式集...
Dopamine:谷歌出品,主要提供Distributional DQN算法,不支持多GPU。RLpyt:BAIR的PyTorch框架,支持多卡并行,使用SyncRl进行采样。PARL:百度的框架,利用PaddlePaddle,支持多机多卡,但需用其专属库。Acme:Google DeepMind的框架,支持多机多卡,但同样不支持PyTorch。rl_games:支持GPU加速和多智能体训练,但...