快搜汉语词典

首页 > value-based和policy-based的区别是什么

value-based和policy-based的区别是什么

2025-01-08 19:14:06

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

(深入理解)强化学习中的policy-based和value-based区别是什么?

其中R表示Q(s,a)值(这里才用上,之前都不用Q,和value-based完全不一样)。所以说两者的区别已经够明显了吧!两者的经典算法如下: value-based:sarsa,q-learning,DQN policy-based:policy-gradient思想下属的REINFORCE算法当然了,最近有将两者结合的方法,如下: 完结撒花...

缩写

今日热搜

上海网友集中晒蘑菇

近反义词

相关词语

相关搜索

© 快搜词典

网上黑客追款大户黑客追款正规黑客业务