如上指定了可学习参数net.layer.bias(这是网络中的一个偏置参数)的学习率lr为0.01,weight_decay为0(也就是没有正则化项)。 对于非常简单的模型,我们可以手动把可学习参数写成如上代码中的字典形式,但对于比较复杂的模型很难手动一个一个的分离出来。通过分析发现,对于比较复杂的模型,其中所有的偏置参数的名字中都...