解析解可以进⾏很好的数学分析,但解析解的限制很严格,导致它⽆法应⽤在深度学习⾥。 小批量随机梯度下降(104)(批量大小、学习率、超参数(hyperparameter)、调参、验证数据集、泛化的概念) 即使在我们⽆法得到解析解的情况下,我们仍然可以有效地训练模型。 梯度下降(gradient descent)法,这种⽅法⼏乎可以...