摘要 针对在减少战场资源浪费、平衡战场效费比的同时提高目标探测概率,保证目标的可持续跟踪,提出利用改进Actor-Critic算法的多传感器交叉提示技术进行目标探测。首先,综合传感器探测、能耗、时效等因素搭建基于“交叉提示”传...展开更多 To reduce the waste of battlefield resources,balance the cost-effectiveness ratio...
其为基于改进ActorCritic算法搭建的深度神经网络;训练基于改进ActorCritic算法搭建的深度神经网络,以获得自适应威胁缓解代理;基于自适应威胁缓解代理输出最优自适应网络威胁缓解策略,基于最优自适应网络威胁缓解策略来改变网络安全部署;该方法对ActorCritic算法进行改进,对于长序列,不完全信息的观测环境效果更好,能产生更好...
基于上述背景,本研究建立了一套燃料电池混合动力汽车的仿真模型,并开发出了三种基于深度强化学习算法的能量管理策略即基于Deep Deterministic Policy Gradient(DDPG),Twin delayed deep deterministic policy gradient(TD3)的能量管理策略和一种新的基于改进的Soft Actor-Critic(Improved SAC,ISAC)算法的能量管理策略.其中,...