1、为解决上述问题,本发明提供一种基于逆强化学习的自动驾驶选道决策方法和系统。 2、本发明收集自动驾驶选道决策任务中的专家轨迹,并在现有强化学习的行动器-评判器架构上,提出了一种用于自动驾驶选道决策的逆强化学习方法。本发明的技术方案是: 3、基于逆强化学习的自动驾驶选道决策方法,包含如下步骤: 4、s1.构...
基于模型控制的深度强化学习算法研究 近些年来,深度强化学习在视觉、语音、自然语言处理、自动驾驶、无人机、控制机器人武器、游戏等各个领域都取得了显著成果,引起了学术界、工业界的广泛研究。然而,目前... 李东雨 - 大连理工大学 被引量: 0发表: 2020年 基于相对熵深度逆强化学习的自动驾驶系统及方法 本发明涉及...