而如果采用的是 GP,应该在V(G,D)V(G,D)之后再加一个 gradient penalty 的惩罚项,可参考自https://github.com/eriklindernoren/PyTorch-GAN/blob/master/implementations/wgan_gp/wgan_gp.py。具体来说可以求出D(y)D(y)对于yy的梯度,由于yy是随机选择的很多个,因此这个梯度 会有 norm(均值)NN,施加一个...