dropout是通过随机使一些神经元失效来进行正则化的。 首先dropout能够使一些神经元失效,从而使得模型复杂度降低,从而能够缓解过拟合, 其次,因为dropout随机使得一些神经元失效,那么说明每个神经元并不是时刻有效的,那么就不会被赋予较大的权重,从而达到缓解过拟合的效果。 我们可以看看torch中dropout的效果: data = th....