就特征数量而言, 高维数据如今在机器学习问题中变得越来越普遍。要从这些海量数据中提取有用的信息, 你必须使用统计技术来减少噪声或冗余数据。这是因为你经常不需要使用所有可用特征来训练模型。通过仅提供那些不相关且非冗余的特征, 可以改善模型。这就是特征选择起着重要作用的地方。它不仅有助于更快地训练模型, ...
别担心,我们使用的不是黑暗魔法,而是SHAP(SHApley Additive exPlanations)的力量。 为了在特征选择过程中更好地利用 SHAP 的功能,我们发布了 shap-hypetune:一个用于同时调整超参数和特征选择的 Python 包。它允许在为梯度提升模型定制的单个管道中组合特征选择和参数调整。它支持网格搜索或随机搜索,并提供基于包装的特...