"批量梯度下降" 指的是在梯度下降的每一步中,我们都用到了所有的训练样本。在梯度下降计算微分求导项时,我们需要进行求和运算,即在每一个单独的梯度下降中我们最终都要计算图1-8中的这样一个东西, 图1-8 这个项需要对所有m个训练样本求和,因此批量梯度下降法这个名字说明了我们需要考虑所有这一"批"训练样本。...