在本研究中,新加坡南洋理工大学吕辰博士团队开发了一种新型的“人在回路的深度强化学习(human-in-the-loop deep reinforcement learning)Hug-DRL算法”,将人类的智能以实时在线、辅助引导的方式引入强化学习智能体的训练过程。通过设计与强化学习智能...
新加坡南洋理工大学吕辰在中国工程院院刊Engineering 2023年2月刊发表了题目为《人在回路的深度强化学习算法及其在自动驾驶智能决策中的应用》的研究性文章,开发了一种基于实时人类指导(Hug)的深度强化学习(DRL)方法,用于端到端自动驾驶案例中的策略训练。通过新设计的人类与自动化之间的控制转移机制,人类能够在模型训练...
由于机器学习智力和能力有限,它目前仍无法处理各种情况,因此不能在现实应用中完全取代人类.因为人类在复杂场景中表现出稳健性和适应性,所以将人类引入人工智能(AI)的训练循环并利用人类智慧进一步提升机器学习算法变得至关重要.本研究开发了一种基于实时人工指导(Hug)的深度强化学习(DRL)方法,用于端到端自动驾驶案例中的...