专利摘要:本发明公开了基于多智能体近端策略优化算法的区域信号灯控制方法,该方法包括以下步骤:将交通流量信息分别输入各自交叉口的策略网络;将区域中的多个交叉口配时方案进行数组合并;获取全局的交通流量状态和配时方案集合进行数组合并;将新的全局状态集合输入到价值网络;将局部交通流量信息输入到更新后的策略网络中;...
多智能体协作城市高层消防一直是具有挑战性的问题,利用无人机来执行消防任务是一个有效的解决方案.在这项工作中,我们将城市高层消防问题表述为一个部分可观测的马尔可夫决策过程(POMDP),并提出一种带有β-变分自动编码器(β-VAE)的多智能体近端策略优化(MAPPO)算法来解决它.该算法基于Actor-Critic体系...
摘要 城市高层消防一直是具有挑战性的问题,利用无人机来执行消防任务是一个有效的解决方案。在这项工作中,我们将城市高层消防问题表述为一个部分可观测的马尔可夫决策过程(POMDP),并提出一种带有β-变分自动编码器(β-VAE)的...展开更多 Urban high-rise firefighting has been a challenging problem,where unmanned...
首先,建立了数据中心双层时空优化调度框架,对数据中心工作负载,IT设备,空调设备进行详细建模;在此基础上,提出数据中心的双层优化调度模型,上层以IDC运营管理商总运营成本最小为目标进行时间维度调度,下层以各IDC运行成本最低为目标进行空间维度调度;然后,介绍多智能体近端策略网络算法原理,设计数据中心双层优化调度模型的...
本发明公开了一种基于多智能体近端策略优化算法的深空探测器任务规划方法,包括:将多智能体规划问题建模为多智能体马尔科夫决策过程;依据多智能体马尔科夫决策过程,构建深空探测器多智能体任务规划环境;构建深空探测器多智能体近端策略优化模型;训练深空探测器多智能体近端策略优化模型,得到多智能体任务规划最优策略;...