根据性能和效率对强化学习控制器进行了比较,并与经典线性二次调节器(LQR)控制器进行了单独比较。每个强化学习控制器都与一个摆动上升控制器集成在一起。一个虚拟开关根据相对于垂直平面的角偏差θ的值自动切换摆动上升控制器和强化学习控制器。 文献1: 强化学习算法在摆车问题中的比较...