快搜汉语词典

首页 > dqn对比q-learning

dqn对比q-learning

2025-02-16 18:29:10

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

【强化学习】Q-learning、Sarsa、DQN、Policy-Gradient、AC、DPG、DD...

举例子来说,Sarsa是同策略,其他带Q函数的都是异策略。 Q-learning、AC用到了Q函数的max,相当于用了另一张Q表,是异策略。 DQN用到了target model(这是个训练model),这个target model积累几次学习的效果,才会和本次交互的model做一个更新,所以是异策略。 DDPG也用到了target model,所以是异策略。 PG有点特殊...

缩写

今日热搜

上海网友集中晒蘑菇

近反义词

相关词语

相关搜索

© 快搜词典

网上黑客追款大户黑客追款正规黑客业务