标准化是特征工程中常用的一种数据预处理方法,它可以帮助我们将不同特征的取值范围统一,以便更好地让模型学习到特征之间的权重关系。下面我将详细介绍特征工程中的标准化方法。 1. 标准化的概念: 标准化是指将原始数据按照一定的规则进行转换,使得转换后的数据符合某种标准分布。在特征工程中,通常是指将数据按照均值...
后面以2021年研究生数学建模B题为例【空气质量预报二次建模】再进行一个教学。 首先讲几个问题:数据清洗、特征选择作用和方法。 1.常见的特征工程包括: 异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断; 特征归一化/标准化: 标准化(转换为标准正态分布); 归一...