若要将删除后的结果保留,则设置inplace=True。原来的df则替换成删除重复值后的DataFrame。 df.drop_duplicates(subset='category',inplace=True) df 5、drop_duplicates(ignore_index) 若需要重置索引,则设置ignore_index=True df.drop_duplicates(ignore_index=True) ...
下图是我们需要操作的数据源,从第二行往下都是重复数据。① 全部列都选中时,就不用设置subset参数 ② 设置keep=last,就会看到默认的索引是最后一行 ③ 在上面的基础上设置ignore_index=True,可以看到索引进行重新排列 ④ 设置keep=False,就会删除所有重复的数据行 ...
ignore_index: 设置是否忽略行索引,默认False,去重后的结果的行索引保持原索引不变。如果设置为True,则结果的行索引被重置为0开始的自然数。 drop_duplicates()基本使用 df3 = pd.DataFrame( {'A': ['a0', 'a1', 'a1', 'a2', 'a2'], 'B': ['b0', 'b1', 'b1', 'b2', 'b2'], 'C': [...
df=df.drop_duplicates(subset=['sex'],keep='last')print(df) ignore_index参数测试 ignore_index=True重新排序 我们测试的时候能看到我们用的是保存后面的行值。true就是重新排序,我们会看到行是0,1,2的排序。 代码语言:javascript 复制 importpandasaspdimportnumpyasnp df=pd.DataFrame({'name':['张丽华'...
ignore_index: 设置是否忽略行索引,默认False,去重后的结果的行索引保持原索引不变。如果设置为True,则结果的行索引被重置为0开始的自然数。 drop_duplicates()基本使用 df3=pd.DataFrame({'A':['a0','a1','a1','a2','a2'],'B':['b0','b1','b1','b2','b2'],'C':['c0','c1','c1','c2...
ignore_index: 可选参数,布尔值。如果设置为True,则结果对象的索引将被重置为默认整数索引;默认为False。4. 使用drop_duplicates()函数删除数据框中重复项的示例 python import pandas as pd # 创建一个包含重复行的DataFrame data = {'Name': ['Tom', 'Nick', 'Tom', 'Juli'], 'Age': [20, 21, 20...
# 方法一df.drop_duplicates(ignore_index=True)# 方法二df.drop_duplicates().reset_index(drop=True)# 方法三df.index =range(df.shape[0]) 参考链接:drop_duplicates去重详解 参考链接:Pandas之drop_duplicates:去除重复项 参考链接:pandas.DataFrame.drop_duplicates ...
Pandas has a built in function to accomplish this task,它允许您通过一种替代的、更简单的方法来...
ignore_index:布尔值,默认为False,如果为True,则生成的行索引将被标记为0、1、2、...、n-1。返...
ignore_index=True重新排序 我们测试的时候能看到我们用的是保存后面的行值。true就是重新排序,我们会看到行是0,1,2的排序。 importpandasaspdimportnumpyasnp df=pd.DataFrame({'name':['张丽华','李诗诗','王语嫣','赵飞燕','阮玲玉'],'sex':['girl','woman',np.nan,'girl','woman'],'age':[22...