Learning Network)网络结构.在此基础上设计了移动机器人的奖励函数,目标空间与动作空间,将深度强化学习算法应用于三维仿真环境中.构建标准静态障碍环境,复杂静态障碍环境与复杂动态障碍环境三个场景.对算法奖励值曲线与相应场景下的路径结果进行分析,随着环境复杂度的不断提高,传统算法的避障时间明显增大.H-TDQN算法下...
目前对单智能体的路径规划方法有很多:一是使用搜索算法,如姜涛,等[3]提出利用Dijkstra 算法提高路径规划中的定位精度问题,使机器人与障碍物之间距离最大化,使移动机器人的运动轨迹具有较高的可执行性,减少碰撞几率,实现了小型移动机器人在信号丢失情况下的自主返航;陈靖辉,等[4]基于A*算法,通过消除对称路径...