一个常见的需求是将数据缩放到 0 到 1 之间的区间。这个过程被称为数据归一化,它可以确保数据在相同的尺度上进行比较和分析。 在Python 中,我们可以使用 scikit-learn 库提供的 MinMaxScaler 类来实现数据缩放。 安装依赖 首先,我们需要安装 scikit-learn 库。可以使用以下命令来安装: pip install scikit-learn ...
total_train_df = (total_train_df - total_train_mean) / total_train_std 进行特征的缩放,比如使用规范化,是一种进行缩放的常用方法:减去平均值并除以每个特征的标准偏差 均值和标准差仅在使用训练数据进行计算,以使模型无法访问验证和测试集中的值。