改进和区别(相比于DQN): 动作空间: 最显著的区别是,DDPG专门设计用于解决连续动作空间的问题,而DQN适用于离散动作空间。DDPG可以输出连续动作的确定性策略,而DQN通常输出离散动作的概率分布。 策略优化:DDPG学习一个确定性策略,而DQN学习一个值函数,然后通过贪心策略选择最佳动作。这使得DDPG更适合处理连续动作空间,而D...
单项选择题 Q learning和DQN的区别在于() A、Qlearning能处理连续动作,DQN不能 B、Qlearning是off-policy,DQN是on-policy C、DQN使用了神经网络和经验回放 D、以上都不对 点击查看答案
Q learning和DQN的区别在于() A. 以上都不对 B. Qlearning是off-policy,DQN是on-policy C. Qlearning能处理连续动作,DQN不能 D. DQN使用了神经网络和经验回放 题目标签:区别如何将EXCEL生成题库手机刷题 如何制作自己的在线小题库 > 手机使用 分享 反馈 收藏 举报 ...