Pytorch学习笔记09---SGD的参数几个重要的参数:学习率 (learning rate)、Weight Decay 权值衰减、Momentum 动量 1.学习率 (learning rate) 学习率 (learning rate),控制模型的学习进度: 学习率(Learning Rate,常用η表示。)是一个超参数,考虑到损失梯度,它控制着我们在多大程度上调整网络的权重。值越低,沿着向下的...
Pytorch学习笔记09---SGD的参数几个重要的参数:学习率 (learning rate)、Weight Decay 权值衰减、Momentum 动量 1.学习率 (learning rate) 学习率 (learning rate),控制模型的学习进度: 学习率(Learning Rate,常用η表示。)是一个超参数,考虑到损失梯度,它控制着我们在多大程度上调整网络的权重。值越低,沿着向下...