这也说明了训练神经网络是可能的,因为损失(作为模型参数的函数)通常具有许多非常相似的局部最小值。 \quad 具体来说,在我们的实验中,我们发现了以下现象: 我们观察到,当对 x + S 内随机选择的起始点执行投影的 l_\infty 梯度下降时,攻击算法所实现的损失会以相当一致的方式增加,并迅速达到平稳状态。下图是从...