题目 以下有关DQN的说法错误的是( )。 A.DQN与 Q-leanring类似,都是基于值迭代的算法B.DQN在训练过程中使用经验回放机制,在线处理得到的转移样本C.Deep Learning与 Reinforcement Learning结合这成为了DQND.当状态和动作空间是高维连续时,Q-Table的使用会变得十分简单 答案 D 解析收藏...