# 保留指定的列,比如保留Name和Salary列columns_to_keep=['Name','Salary']df_kept=df[columns_to_keep] 1. 2. 3. 上述代码中,我们创建了一个名为"columns_to_keep"的列表,其中包含了我们要保留的列的名称。然后,我们使用切片操作,通过将这个列表作为索引,从原始DataFrame中提取出需要的列。最终,我们得到了...
<class 'pandas.core.frame.DataFrame'> RangeIndex: 1945 entries, 0 to 1944 Data columns (total 5 columns): # Column Non-Null Count Dtype --- --- --- --- 0 销售日期 1945 non-null datetime64[ns] 1 销售区域 1945 non-null object 2 销售渠道 1945 non-null object 3 品牌 1945...
在 Pandas中pivot()方法提供了这样的功能,它会根据给定的行或列索引重新组织一个 DataFrame对象。 3.2.1 pivot()方法 index:用于创建新 DataFrame对象的行索引。 columns:用于创建新 DataFrame对象的列索引 values:用于填充新 DataFrame对象中的值。 4. 数据转换 4.1 重命名轴索引 Pandas中提供了一个rename()...
DataFrame.reindex与axis=1或'columns'(0.21+) 然而,我们也有reindex,在最近的版本中你指定axis=1删除: df.reindex(cols_to_keep, axis=1) # df.reindex(cols_to_keep, axis='columns') # for versions < 0.21, use # df.reindex(columns=cols_to_keep) 3 5 A x x B x x C x x 在旧版本上,...
DataFrame.mask(cond[, other, inplace, …]) #Return an object of same shape as self and whose corresponding entries are from self where cond is False and otherwise are from other. DataFrame.query(expr[, inplace]) #Query the columns of a frame with a boolean expression. ...
上述数据源,先将一连串数据赋值给字典“测试数据_字典”,然后通过pandas.DataFrame方法将字典数据转成pandas对象“测试_p”。记住“测试_p”后续所有操作都基于此对象。3 行列操作 回忆一下,平时使用excel处理数据时,经常需要修改表头,删减某些列等这些常规操作,使用pandas同样可以实现。看看主要用法:Ø 获取...
python--Pandas中DataFrame基本函数(略全) pandas里的dataframe数据结构常用函数。 构造函数 方法描述 DataFrame([data, index, columns, dtype, copy])构造数据框 属性和数据 方法描述 Axesindex: row labels;columns: column labels DataFrame.as_matrix([columns])转换为矩阵 ...
DataFrame.shape 返回数据框的形状 DataFrame.memory_usage([index, deep]) Memory usage of DataFrame columns. 类型转换 方法 描述 DataFrame.astype(dtype[, copy, errors]) 转换数据类型 DataFrame.copy([deep]) 复制数据框 DataFrame.isnull() 以布尔的方式返回空值 ...
这里提到了index和columns分别代表行标签和列标签,就不得不提到pandas中的另一个数据结构:Index,例如series中标签列、dataframe中行标签和列标签均属于这种数据结构。既然是数据结构,就必然有数据类型dtype属性,例如数值型、字符串型或时间类型等,其类型绝大多数场合并不是我们关注的主体,但有些时候值得注意,如后文中...
df = pd.DataFrame(np.random.randint(0, 10, (3, 2)), columns=['A', 'B']) # 将数据拆分成两份,并保存在列表中 data_list = [df[0:2], df[3:]] # 索引值不延续 df1 = pd.concat(data_list, ignore_index=False) # 索引值延续 ...