DataFrame.drop(labels=None,axis=0,index=None,columns=None, inplace=False) 参数说明: labels 就是要删除的行列的名字,用列表给定 axis 默认为0,指删除行,因此删除columns时要指定axis=1; index 直接指定要删除的行 columns 直接指定要删除的列 inplace=False,默认该删除操作不改变原数据,而是返回一个执行删除...
-- axis为0时表示删除行,axis为1时表示删除列 3、常用参数如下: 代码: importpandas as pd df1= pd.DataFrame([['Snow','M',22],['Tyrion','M',32],['Sansa','F',18],['Arya','F',14]], columns=['name','gender','age'])print(df1)print('---删除行或列:DataFrame.drop()---')#d...
print(frame.drop(['a']))print(frame.drop(['b'], axis = 1))#drop函数默认删除行,列需要加axis = 1 (2)inplace参数 1. DF.drop('column_name', axis=1);2. DF.drop('column_name',axis=1, inplace=True)3. DF.drop([DF.columns[[0,1, 3]]], axis=1, inplace=True) 对原数组作出...
import pandas as pd df = pd.DataFrame(columns=['Name', 'Age']) df.loc[1, 'Name'] = 'Rocky' df.loc[1, 'Age'] = 21 df.loc[2, 'Name'] = 'Sunny' df.loc[2, 'Age'] = 22 df.loc[3, 'Name'] = 'Mark' df.loc[3, 'Age'] = 25 df.loc[4, 'Name'] = 'Taylor' df....
求每个班级的人数,首先可以直接使用gruop by 分组,取出任意一列元素进行count 没有出现粗字体说明这是Series类型,我们可以给他重新设置一个索引,释放clazz列 reset_index() :重置索引 rename() :修改列的索引名称 格式:rename(columns={"原来的列名:新的列名"}) ...
df.drop(columns = ['col1','col2'...]) df.pop('col_name') del df['col_name'] In the last section, we have shown the comparison of these functions. So stay tuned… Also, See: Drop duplicates in pandas DataFrame Drop columns with NA in pandas DataFrame ...
df.rename(columns={ 'category': 'category-size'}) 7、删除后出现的重复值: 代码语言:javascript 代码运行次数:0 运行 AI代码解释 df['city'].drop_duplicates() 8 、删除先出现的重复值: 代码语言:javascript 代码运行次数:0 运行 AI代码解释 df['city'].drop_duplicates(keep='last') 9、数据替换:...
df = pd.read_excel("test.xlsx", dtype=str, keep_default_na='') df.drop(columns=['寄件地区'], inplace=True) 5、列表头改名(补充) 如下:将某列表头【到件地区】修改为【对方地区】 df = pd.read_excel("test.xlsx", dtype=str, keep_default_na='') df = df.rename(columns={'到件地区...
df.drop_duplicates() 删除重复的数据。实例 # 删除包含缺失值的行或列 df.dropna() # 将缺失值替换为指定的值 df.fillna(0) # 将指定值替换为新值 df.replace('old_value', 'new_value') # 检查是否有重复的数据 df.duplicated() # 删除重复的数据 df.drop_duplicates()数据...
这里提到了index和columns分别代表行标签和列标签,就不得不提到pandas中的另一个数据结构:Index,例如series中标签列、dataframe中行标签和列标签均属于这种数据结构。既然是数据结构,就必然有数据类型dtype属性,例如数值型、字符串型或时间类型等,其类型绝大多数场合并不是我们关注的主体,但有些时候值得注意,如后文中...