# 归一化数据scaler = StandardScaler()X_train_scaled = scaler.fit_transform(X_train)X_test_scaled = scaler.transform(X_test) # 获取归一化后的混淆矩阵cm_with_norm = get_confusion_matrix(X_train_scaled, X_test_scaled, ...
scaler = StandardScaler(copy=True, with_mean=True, with_std=True) X_train_scaled = scaler.fit_transform(X_train) X_test_scaled = scaler.transform(X_test) # 训练决策树分类器 clf = DecisionTreeClassifier(random_state=42) clf.fit(X_train_scaled, y_train) # 预测测试集 y_pred = clf.pre...
print('仅仅拟合为进行标准化转换的scaler标准差:scaler_std=',np.sqrt(scaler.var_)) #var_算的是训练集的方差 print('\n标准化 X 转换后:scaler_transform_X\n',scaler.transform(X) ) print('\n标准化 X 转换后均值:mean=',scaler.transform(X).mean(axis= 0 )) print('标准化 X 转换后标准差...
from sklearn.preprocessing import StandardScaler scaler = StandardScaler() array_s = scaler.fit_transform(df_s) df_scal = pd.DataFrame(array_s, columns=[i+'_std' for i in select_col]) df_scal.boxplot(figsize=(11,5)) plt.show() 标准化之后,分布看起来更好。 由于我们的数据集有多个特征...
scaler = StandardScaler()data_scaled = scaler.fit_transform(data)四、模型构建与训练:实现线性回归 接下来,我们将使用Scikit-learn库构建和训练线性回归模型。通过分割数据集为训练集和测试集,我们可以评估模型在未见过的数据上的表现。from sklearn.model_selection import train_test_split from sklearn.linear_...
X_test_scaled = scaler.transform(X_test) # 4. 初始化Ridge回归模型并设置参数 ridge_reg = Ridge(alpha=1.0, fit_intercept=True, solver='auto', random_state=42) # 5. 训练模型 ridge_reg.fit(X_train_scaled, y_train) # 6. 评估模型性能 ...
# X_scaled = scaler.fit_transform(X_1) # y_scaled = scaler.fit_transform(y_1.reshape(-1, 1)) # df = df[df['view_time']<=14262] X_s_learner=df.drop(['group_name', 'statis_id','view_time','y_pred_shiyan_all','y_pred_duizhao_all','t_learner_result'], axis=1).to_...
X_train = pd.DataFrame(scaler.fit_transform(dataset_train), columns=dataset_train.columns, index=dataset_train.index) # Random shuffle training data X_train.sample(frac=1) X_test = pd.DataFrame(scaler.transform(dataset_test), columns=...
scaled_data = scaler.fit_transform(data) print(scaled_data) 2、缺失值处理 特征预处理其中一个关键的环节是处理缺失值。缺失值会影响模型的性能,因此需要采取适当的策略来处理它们。Python 中有多种方法可以处理缺失值,主要使用 Pandas 和 Scikit-learn 库。
scaler = StandardScaler() X_scaled = scaler.fit_transform(X) print("原始特征矩阵的形状:", X.shape) print("选择最重要的2个特征后的形状:", X_new.shape) print("标准化特征后的形状:", X_scaled.shape) 在上面的示例中,我们首先加载了Iris数据集作为示例数据。然后,我们使用SelectKBest来选择最重要...