这个深度就是神经网络的意思。你去翻15那篇DQN经典文章你会看到强化学习的loss是为了训练神经网络,使神...
深度学习(Deep Learning) 强化学习 (Reinforcement Learning) 深度强化学习 深度强化学习,LOSS和train曲线震荡明显的原因?求助:SAC算法,一个很简单的任务,学习率1.0e-4,batch_size256,为什么train曲线和critic loss震荡如此明显? [图片…显示全部 关注者1 被浏览16 关注问题写回答 邀请回答 好问题 ...