Reinforcement learning library(framework) designed for PyTorch, implements DQN, DDPG, A2C, PPO, SAC, MADDPG, A3C, APEX, IMPALA ... - iffiX/machin
APEX APEX的框架结构比较简单,可以套用任何off-policy的算法,涵盖离散动作空间算法DQN (including DDQN, Prior. DQN, Duel. DQN, Distrib. DQN, Noisy DQN),也包括处理连续动作空间的策略梯度算法,例如DDPG(including TD3, BiResDDPG),SAC。 框架图: 代码框架图: 从代码框架中可以看出: 1.multiprocessing.Process...
APEX的框架结构比较简单,可以套用任何off-policy的算法,涵盖离散动作空间算法DQN (including DDQN, Prior. DQN, Duel. DQN, Distrib. DQN, Noisy DQN),也包括处理连续动作空间的策略梯度算法,例如DDPG(including TD3, BiResDDPG),SAC。 框架图: 代码框架图: 从代码框架中可以看出: 1.multiprocessing.Process启动所...