TD3算法不仅能够应对连续动作空间而且具有高稳定性的特点。另外,改进的TD3算法使学习的过程更加迅速,算法的结果也更加收敛。仿真结果表明,基于该算法的改进,通信干扰成功率比原算法提升了28%。 【总页数】6页(P13-17) 【作者】安国臣;毕胜;王晓君 【作者单位】河北科技大学信息科学与工程学院 【正文语种】中文 【...
为了提高无人机(Unmanned Aerial Vehicle,UAV)系统的智能避障性能,提出了一种基于双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient,TD3)的改进算法(Improved Twin Delayed Deep Deterministic Policy Gradient,I-TD3).该算法通过设置两个经验缓存池分离成功飞行经验和失败飞行经验,并根据两个经验...
内容提示: 计算机工程与应用 Computer Engineering and Applications ISSN 1002-8331,CN 11-2127/TP 《计算机工程与应用》网络首发论文 题目: 改进 TD3 算法在四旋翼无人机避障中的应用 作者: 唐蕾,刘广钟 网络首发日期: 2020-07-14 引用格式: 唐蕾,刘广钟.改进 TD3 算法在四旋翼无人机避障中的应用.计算机工程...
6.发明目的:本发明提出提出一种基于探索策略改进的td3算法的自动驾驶车 辆车道保持方法,改善了无人驾驶车辆与环境交互过程中获得的训练样本的质量, 提升了算法的表现性能;使自动驾驶车辆的探索趋向于正确的方向。 7.技术方案:本发明提供了一种基于探索策略改进的td3算法的自动驾驶车辆 车道保持方法,包括以下步骤: 8...
摘 要:针对某卫星搭载的4自由度机械臂轨迹规划问题,提出了一种基于改进的双延迟深度确定性策略梯度(TD3)算法的智能规划方法。该方法采用分阶段训练策略,在预训练阶段,采用了目标位置引导联合TD3算法进行轨迹优化的混合规划策略,训练结束后规划算法能够在机械臂关节空间对任意起点、终点进行速度轨迹的自主规划。这...
在执行区域侦察任务时,无人机需要更高性能的算法,以便对未知辐射源目标进行快速准确定位.利用改进的双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient, TD3)算法实现无人机快速侦察目标.针对TD3算法的单策略网络输出动作波动大问题,提出构建双策略网络来缓解,并提出利用带修正偏差的指数移动加权...
的任务卸载策略,以最小化任务处理延迟和能源消耗之间平衡的长期成本为目标,将车联网中的任务卸载问题建模为马尔可夫决策过程(MDP),提出了在传统双延时深度确定性策略梯度(TD3)的基础上,利用长短期记忆网络(LSTM)来逼近策略函数和价值函数,将系统状态进行归一化处理以加速网络收敛并增强训练稳定性的改进算法(LN-TD3)...
本文提出基于改进TD3算法的车道保持端到端决策新方案.首先,构建多数据融合TD3算法框架,感知自主车辆运动学数据信息和视觉图像信息来提升算法的稳定性.并且结合注意力... 田康,于镝,李擎,... - 《北京交通大学学报》 被引量: 0发表: 2022年 基于强化学习的高速公路自动驾驶决策方法研究 近年来,各种基于人工智能...
提出了一种基于威胁网的飞行器航迹快速搜索算法.该方法能够在具 有未知威胁的飞行环境中在线进行实时航迹规划.首先根据获得的先验信息建立威胁网,其次在建立的威胁网... 杜萍,杨春,赵东平 - 《飞行力学》 被引量: 20发表: 2005年 无人机航迹规划中动态威胁评估方法 无人机利用动态威胁评估方法可以对航迹中的动态...
所以针对切换技术中的相关算法进行改进,从而提高用户满意度和服务质量(QOS)是必要的.本文首先通过对TD-LTE的基本理论包括TD-LTE的网络结构,切换技术做了整体的概述,为切换算法的研究打下理论基础.其次研究和分析了传统切换算法,并在大量阅读文献的基础上,对当前已有切换算法的优缺点进行分析,得出论文进行算法改进和仿真...