LassoCV 特征选择 python 本文介绍使用tsfresh库进行时序 Freature Extract,结合Lasso进行建模。 一、背景 众所周知,lasso是机器学习鼻祖之一Robert Tibshirani之作,以L1正则作为特征筛选的回归模型,在多元回归和高维数据建模中具有广泛的应用,但在时序模型中使用的较少,可以查到的几篇文章中文期刊中,主要使用在
决策树是一种常见的机器学习算法,它能够根据数据的特征变量将数据分成不同的类别,并找到最佳的划分方式。LASSO模型通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些回归系数,即强制系数绝对值之和小于某个固定值;同时设定一些回归系数为零。因此保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。
print(feature_names) # 决定重要特征 clf = LassoCV().fit(X, y) importance = np.abs(clf.coef_) print(importance) # 从模型特征中选择得分最高的 idx_third = importance.argsort()[-3] threshold = importance[idx_third] + 0.01 idx_features = (-importance).argsort()[:2] name_features = n...