请改用 get_feature_names_out。 根据sklearn.preprocessing.OneHotEncoder。 >>> encoder.get_feature_names_out(['Sex', 'AgeGroup']) array(['Sex_female', 'Sex_male', 'AgeGroup_0', 'AgeGroup_15', 'AgeGroup_30', 'AgeGroup_45', 'AgeGroup_60', 'AgeGroup_75'], dtype=object) ...
如果你真的想按位置定义你的列,你可以这样做: column_names_for_onehot= df.columns[1:]df_2= pd.get_dummies(df, columns=column_names_for_onehot, drop_first=True)
从sklearndocs中,我发现可以通过将参数verbose_feature_names_out设置为**False**来阻止ColumnTransformer...
# 需要导入模块: from sklearn.preprocessing import OneHotEncoder [as 别名]# 或者: from sklearn.preprocessing.OneHotEncoder importfit_transform[as 别名]deftransform(self, X):#print 'getting metadata features'features_to_use = ["requester_account_age_in_days_at_request", \"requester_days_since_...
另外一种将标称型特征转换为能够被scikit-learn中模型使用的编码是one-of-K, 又称为 独热码或dummy encoding。 这种编码类型已经在类OneHotEncoder中实现。该类把每一个具有n_categories个可能取值的categorical特征变换为长度为n_categories的二进制特征向量,里面只有一个地方是1,其余位置都是0。
org/prediction-use-column transformer-one hotencoder-and-pipeline/在本教程中,我们将使用 ColumnTransformer、OneHotEncoder 和 Pipeline 来预测每个具有不同功能的客户的保险费成本。我们将导入必要的数据操作库: 代码:import pandas as pd import numpy as np from sklearn.compose import ColumnTransformer from sk...
另外一种将标称型特征转换为能够被scikit-learn中模型使用的编码是one-of-K, 又称为 独热码或dummy encoding。 这种编码类型已经在类OneHotEncoder中实现。该类把每一个具有n_categories个可能取值的categorical特征变换为长度为n_categories的二进制特征向量,里面只有一个地方是1,其余位置都是0。
from sklearn.preprocessing import OneHotEncoder 1. OneHotEncoder(categories='auto', sparse='True', dtype='float') 二、函数使用 生成OneHotEncoder类模型。 import pandas as pd data = {'degree':['master','master','PHD'],'grade':['A', 'B', 'C']} ...
在sklearn 0.20.3文档中, init有参数下拉,但是当我使用它时,它会抛出一个类型错误。我没有找到任何使用"drop“关键字的例子,我看到的大多数例子都是使用较早版本的sklearn。在某些情况下,他们使用ColumnTransfer (即使是针对OnehotEncoder的旧版本,因为它给出了未来的
d00010 编码指定列 importpandasaspd df=pd.DataFrame({'A':['a','b','a'],'B':['b','a','c']})df Out[]:A B0a b1b a2a c# Get one hot encoding of columns Bone_hot=pd.get_dummies(df['B'])# Drop column B as it is now encodeddf=df.drop('B',axis=1)# Join the encoded...