首先利用训练图像的 CAM 选择多个像素对作为训练样本,并得到语义密切关系的 label,这些数据用来训练 AffinityNet(如图9左);然后使用训练好的 AffinityNet 在每张图像上进行推理计算以获取该图像邻接图的语义密切矩阵作为概率转移矩阵;最后在该图的 CAM 上以 random walk 的形式使用该矩阵,得到最终优化后的语义分割伪标签...