classsklearn.preprocessing.OneHotEncoder(*, categories='auto', drop=None, sparse=True, dtype=<class'numpy.float64'>, handle_unknown='error') 将分类特征编码为 one-hot 数值数组。 该转换器的输入应该是类似整数或字符串的数组,表示分类(离散)特征所采用的值。这些特征使用one-hot(又名“one-of-K”...
import pandas as pd import numpy as np from sklearn.preprocessing import OneHotEncoder,LabelEncoder oenc=OneHotEncoder(sparse=False) lenc=LabelEncoder() store=pd.DataFrame({'gender':[0.0,11.0,'unknow']}) 方式1:通过pandas中的get_dummies生成, dummies = pd.get_dummies(store['gender'], prefix...
import pandas as pd column_name = encoder.get_feature_names_out(['Sex', 'AgeGroup']) one_hot_encoded_frame = pd.DataFrame.sparse.from_spmatrix(train_X_encoded, columns=column_name) # display(one_hot_encoded_frame) Sex_female Sex_male AgeGroup_0 AgeGroup_15 AgeGroup_30 AgeGroup_45 A...
>>> ohe.setOutputCols(["output"]) OneHotEncoder... >>> model = ohe.fit(df) >>> model.setOutputCols(["output"]) OneHotEncoderModel... >>> model.getHandleInvalid() 'error' >>> model.transform(df).head().output SparseVector(2, {0: 1.0}) >>> single_col_ohe = OneHotEncoder...
热编码(One-Hot Encoding)是一种将分类数据转换为机器学习算法易于处理的格式的方法。在Scikit-learn库中,我们可以使用OneHotEncoder类轻松实现热编码。通过热编码,我们可以将分类数据转换为二进制向量,从而使其能够被大多数机器学习算法所使用。 希望本文能帮助您了解Python中Scikit-learn库的热编码技术,并在实际应用中...
# 导入所需的库fromsklearn.preprocessingimportOneHotEncoderimportpandasaspdimportnumpyasnp# 创建一个包含分类变量的数据集data=pd.DataFrame({'颜色':['红','绿','蓝','红','绿','蓝'],'数量':[10,20,30,40,50,60]})# 使用OneHotEncoder对分类变量进行编码encoder=OneHotEncoder(sparse=False)encoded...
[1, 0, 2]])#doctest: +ELLIPSISOneHotEncoder(categorical_features='all', dtype=<...'numpy.float64'>, handle_unknown='error', n_values='auto', sparse=True)>>>enc.n_values_ array([2, 3, 4])>>>enc.feature_indices_ array([0,2, 5, 9])>>> enc.transform([[0, 1, 1]]).to...
OneHotEncoder(categorical_features='all', dtype=<...'numpy.float64'>, handle_unknown='error', n_values='auto', sparse=True) >>>enc.n_values_ array([2,3,4]) >>>enc.feature_indices_ array([0,2,5,9]) >>>enc.transform([[0,1,1]]).toarray() ...
encoder = OneHotEncoder(sparse=False) # 将数据转换为numpy数组 data_array = np.array(data) # 对数据进行One-Hot编码 onehot_encoded = encoder.fit_transform(data_array) # 打印One-Hot编码后的结果 print(onehot_encoded) 这个例子中,我们有一个包含分类数据的特征,如猫、狗和鸟。我们使用OneHotEncoder...
方法二:使用OneHotEncoder() fromsklearn.preprocessingimportOneHotEncoder#将值变为数组形式,这样才能进行处理values = df['class'].values#注意 OneHotEncoder(sparse=False),不然返回的就是索引值的形式onehot_encoder = OneHotEncoder(sparse=False)