选择一个适中的Batch_Size值。就是说我们选定一个batch的大小后,将会以batch的大小将数据输入深度学习的网络中,然后计算这个batch的所有样本的平均损失,即代价函数是所有样本的平均。 随机(Batch_Size等于1的情况)(红色) 每次修正方向以各自样本的梯度方向修正,横冲直撞各自为政,难以达到收敛。 适当的增加Batch_Size...