对此,首先在 Atari 游戏,即动态视频中实现深度Q 网络(Deep Q Network,DQN)智能体模型;其次使用快速梯度符号方法(Fast Gradient SignMethod,FGSM)白盒攻击与黑盒攻击、投影梯度下降(Projected Gradient Descent,PGD)攻击和像素攻击对 DQN 模型进行对抗攻击实验;最后使用基于高斯数据增强的随机化防御和对抗训练...