对batch求算loss时loss是张量形式或是标量有什么不同? 一般情况下我们使用一个batch的数据计算出一个平均的loss,再使用这个loss反向传播求得模型参数的梯度并更新,例如: loss = tf.reduce_mean(y - y_pred)# 文中y和y_pred的shape均为:[b, 1],其中b是batch_size. 这种情况比较好理解,loss只是一个值,其...
loss曲线边下降边震荡可能是什么原因 | 最近在跑图像分割的模型,其他两个数据集都很稳定,isic数据集上,验证loss和训练loss呈这样的曲线,请问大概是什么原因。epoch40,初始学习率0.001,8个epoch衰减0.5,batchsize8 发布于 2023-09-06 17:41・IP 属地贵州 ...