动作空间: 最显著的区别是,DDPG专门设计用于解决连续动作空间的问题,而DQN适用于离散动作空间。DDPG可以输出连续动作的确定性策略,而DQN通常输出离散动作的概率分布。 策略优化: DDPG学习一个确定性策略,而DQN学习一个值函数,然后通过贪心策略选择最佳动作。这使得DDPG更适合处理连续动作空间,而DQN更适合处理离散动作空间...