1.基于二进制人工蜂群算法的通信抗干扰决策方法2.基于改进人工蜂群算法的认知抗干扰智能决策技术研究3.基于改进TD3的自动驾驶车道保持决策方法4.基于改进TD3算法的机械臂智能规划方法研究5.基于改进TD3算法的无人机决策研究 因版权原因,仅展示原文概要,查看原文内容请购买©...
内容提示: 计算机工程与应用 Computer Engineering and Applications ISSN 1002-8331,CN 11-2127/TP 《计算机工程与应用》网络首发论文 题目: 改进 TD3 算法在四旋翼无人机避障中的应用 作者: 唐蕾,刘广钟 网络首发日期: 2020-07-14 引用格式: 唐蕾,刘广钟.改进 TD3 算法在四旋翼无人机避障中的应用.计算机工程...
Tran等 [11] 以携带单目前置摄像头的四旋翼无人机为对象,提出一种基于数据集融合的深度强化学习算法,实现了在密集混乱环境中的自主避障。Kahn等 [12] 提出一种基于不确定感知的深度强化学习方法,通过对碰撞概率的估计,使改进TD3算法在四旋翼无人机避障中的应用唐 蕾,刘广钟上海海事大学 信息工程学院,上海 201306...
(Experience Replay)方法,提高有效经验的采样效率,缓解因无效经验过高导致的训练效率低问题.改进奖励函数,解决因奖励设置不合理导致的训练效果差问题.在AirSim平台上实现仿真实验,结果表明在四旋翼无人机的避障问题上,I-TD3算法的避障效果优于TD3算法和深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法....
在执行区域侦察任务时,无人机需要更高性能的算法,以便对未知辐射源目标进行快速准确定位.利用改进的双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient, TD3)算法实现无人机快速侦察目标.针对TD3算法的单策略网络输出动作波动大问题,提出构建双策略网络来缓解,并提出利用带修正偏差的指数移动加权...
摘 要:针对某卫星搭载的4自由度机械臂轨迹规划问题,提出了一种基于改进的双延迟深度确定性策略梯度(TD3)算法的智能规划方法。该方法采用分阶段训练策略,在预训练阶段,采用了目标位置引导联合TD3算法进行轨迹优化的混合规划策略,训练结束后规划算法能够在机械臂关节空间对任意起点、终点进行速度轨迹的自主规划。这...
的任务卸载策略,以最小化任务处理延迟和能源消耗之间平衡的长期成本为目标,将车联网中的任务卸载问题建模为马尔可夫决策过程(MDP),提出了在传统双延时深度确定性策略梯度(TD3)的基础上,利用长短期记忆网络(LSTM)来逼近策略函数和价值函数,将系统状态进行归一化处理以加速网络收敛并增强训练稳定性的改进算法(LN-TD3)...
基于改进TD3的自动驾驶车道保持决策方法 本文提出基于改进TD3算法的车道保持端到端决策新方案.首先,构建多数据融合TD3算法框架,感知自主车辆运动学数据信息和视觉图像信息来提升算法的稳定性.并且结合注意力... 田康,于镝,李擎,... - 《北京交通大学学报》 被引量: 0发表: 2022年 基于强化学习的高速公路自动...
本发明公开了一种敌方威胁不确定环境下无人机三维全局航迹智能规划方法,首先,依据先验地图建立了无人机的三维环境模型;确定用来评价航迹优劣的三个目标函数,建立敌方威胁不确定环境下的无人机三维全局航迹规划的三目标优化模型;接着,采用改进多目标骨干粒... 张勇,王跃川,巩敦卫,... 被引量: 0发表: 2019年 基于...