它的作用是将一些分类变量,如性别、国家、省份、职业、婚姻状况等变量转换成多个二进制变量,即一个变量有多个可能的值,就可以转化为多个二进制变量,这样可以方便数据分析,更加准确地反应原有数据集合之间的关系。 getdummies函数一般用于处理有因变量和自变量的数据集,一般在建模前,需要将因变量转化为离散变量,而自变量...
它的基本作用就是,帮助我们将非数值数据转换成含有数值的特征,从而让机器学习算法能够更好地检测和分析出定性数据背后的规律,从而改善训练效果。 另外,getdummies函数也可以有效帮助用户解决特征维度爆炸的问题,因为它可以将定性特征值拆分为多个类别,这样就可以有效减少数据集中特征维度的数量,加快模型训练时间。 总之,...
OrdinalEncoder / OneHotEncoder /get_dummies 三个方法都能够将离散的类别特征转换成由数字代表的类别特征.但是三者的特征又不尽相同 不扩展特征个数 OrdinalEncoder (与LabelEncoder用法 效果都是一致的,这里就不再单独说明LabelEncoder) scikit-learn中提供的方法;可以将每一个类别的特征转换成一个新的整数(0到类别数...
pandas.get_dummies()函数代码参数解释 pandas的get_dummies函数的其使用方法