在实际中,设备可能会随着时间动态变化,因此无人机需要根据移动设备的时变位置相应地调整其轨迹。与此同时,上述工作主要集中在传统的基于优化的路径规划算法上,但随着无人机和设备数量的增加,由于优化变量的激增,该方法效率可能不高[5]。在[6]中,通过使用深度神经网络(DNN)进行函数逼近,已经证明深度强化学习(DRL)在...