其中k是迭代次数,d是一个与{x}数量相同的向量,称为下降向量。 算法大致是这样的: 代码语言:javascript 复制 x=x_initwhile||gradient(f(x))||<epsilon:x=x+d 我们一直对x进行更新,直到该点梯度的值足够小(在某个极值处应该达到零值)。 我们将看到3个不同的下降矢量(或方向矢量): 牛顿方向,梯度方向和渐...