一般这个时候那些值不是NAN(无效数字)就是INF(无穷大); 2)检查数据标签是否从0开始并且连...
可以尝试增设归一化层,组归一化,批量归一化都可以试试
可以尝试增设归一化层,组归一化,批量归一化都可以试试
然后调整模块。我建议先把dropout完全去掉试一下。然后一些常见的错误,比如evaluation的时候忘记把batchnorm和dropout层设置为eval mode,可能也会产生意想不到的错误效果。当然也有可能是训练的时间不够长。请尝试训练更多的epochs,有可能测试集精度会进一步上升。因为不清楚你的loss用的是什么,我看到你的...
增加数据集:如果可以的话,尝试增加训练样本。使用数据增强技术(如翻转、旋转、缩放、剪裁等)也可以...