最后,将QR算法结合DQN算法, 将分布式强化学习的思路运用于实际中,详细的描述了QR-DQN算法的实际思路。实验的具体细节就不说了,有兴趣的同学自己看,反正就是实现了很好的效果。 PDF:2019ChenGong/RL-Paper-notes 参考资料: Dabney, Will, et al. "Distributional reinforcement learning with quantile regression."...
QRDQN(Quantile Regression Deep Q-Network)算法是一种用于解决强化学习问题的深度强化学习算法。该算法结合了深度Q网络(DQN)和分位数回归(Quantile Regression)的思想,能够有效地处理连续型动作空间和不确定性。 在传统的DQN算法中,通过使用一个神经网络来估计Q值函数,以选择最佳动作。然而,这种方法在处理连续型动作空...