泰勒公式:一个用函数在某点的信息描述其附近取值的公式 在GBDT中即使用Loss函数在上一轮的预测值上的信息来描述本轮的预测值。GBDT使用了上一轮的Loss值、一阶导;xgb则还用到了二阶导。 一阶泰勒展开如下 将一阶泰勒展开代入Loss函数得 要使得Loss在本轮下降,即保证\(l'(y_i, {\hat{y}}_i^{t-1})...