我们来看看,要是真有这么个L存在,它应该是怎么样的?首先,对于特定的任务来说,A=P−1BP 是给定的,因此它并非变量,我们可以把它当做模型本身的一部分,因此简写成 原文来源:苏神《互怼的艺术:从零直达WGAN-GP》 kexue.fm/archives/4439 编辑于 2023-12-01 15:39・IP 属地广东 ...
image.png 参考资料 [1] Gulrajani, Ishaan, et al. "Improved training of wasserstein gans." Advances in neural information processing systems. 2017. [2]http://www.twistedwg.com/2018/02/02/WGAN-GP.html [3]https://www.jianshu.com/p/7801f9f917d9 [4]https://www.jianshu.com/p/c000b27...
例如,基于Gumbel-Softmax relaxation技术的模型RelGAN在使用推土机距离作为损失函数进行训练时总是会出现判别器的loss几乎等于0的情况,这导致了判别器的参数无法正常更新,进而无法给予生成器有用的指导信息,也就无法形成对抗学习。经过多次实验,这个问题被定位在判别器的结构上,因此提出了一个基于RelGAN和WGAN-GP的新架构,...