基于深度强化学习的移动机器人三维路径规划方法 针对三维未知环境中存在的高复杂度和不确定性的问题,提出一种在有限观测空间优化策略下基于深度强化学习的移动机器人三维路径规划方法.首先,在有限观测空间下采用深度... 马天,席润韬,吕佳豪,... - 《计算机应用》 被引量: 0发表: 2024年 基于深度强化学习哈里斯鹰...
避障形式单一等问题.针对这些问题,提出了一种基于LSTM-PPO的智能体三维路径规划算法.利用虚拟射线探测仿真环境,并将收集到的状态空间和动作状态引入长短时记忆网络.通过额外的奖惩函数和好奇心驱动让智能体学会跳跃通过低矮障碍物,避开大型障碍物.利用PPO算法的截断项机制使得规划策略更新的幅度更加优化.实验结果表明...
The results show that the algorithm is feasible, more intelligent and more reasonable for path planning, and can adapt well to the unknown environment with many obstacles.黄东晋蒋晨凤韩凯丽Journal of Computer Engineering & Applications