mario是属于离散型动作空间,所以要使用DDPG,需要将处理的动作离散化 具体可以看 这个博客·http://t.csdnimg.cn/PemKJ 二、源码-处理连续动作代码 源码是来自这个博主的 DDPG处理连续型动作空间-单摆 ps:安装好视频下面的环境要求 【[重置版]强化学习系列教程8:DDPG 算法 实现单摆的控制 || A2C算法变种】https:...