1.map:只用于Series,实现每个值->值的映射 2.apply,用于Series实现每个值的处理,用于Dataframe实现某个轴的Series的处理 3.applymap:只能用于DataFrame,用于处理DataFrame的每个元素 map用于Series的转换 实例:将 股票代码 英文转换成中文名字 Series.map(dict)or Series.map(function)均可 #1.map用于Series值的转换 ...
df.index.sort_values(ascending=False) # 排序,倒序 df.index.to_frame(index=False) # 转成 DataFrame df.index.unique() # 去重 df.index.value_counts() # 去重分组统计 df.index.where(df.index=='林*') # 筛选,查看是否由该行记录 df.index.max() # 最大值 df.index.map(lambda x:x+'_'...
文章来源:Python数据分析 1.Pandas的函数应用 apply 和 applymap 1. 可直接使用NumPy的函数示例代码: # Numpy ufunc 函数 df = pd.DataFrame(np.random.randn(5,4) - 1) print(df) print(np.abs(d...
EN层次化索引是pandas的一项重要功能,它能使你在一个轴上有多个索引级别,也就是说,它能使你以低维...
1 多层索引(MultiIndex) Pandas的多层索引(MultiIndex)允许你在一个DataFrame的行或列上拥有多个层次化的索引,这使得你能够处理更复杂的数据结构,例如多维时间序列数据或具有层次结构的数据。以下是多层索引的详细说明和示例: 1.1 创建多层索引 你可以使用多种方式来创建多层索引,包括从元组、列表或数组创建,或者通过设置...
()# 不重复值的数量df.index.sort_values(ascending=False)# 排序,倒序df.index.to_frame(index=False)# 转成 DataFramedf.index.unique()# 去重df.index.value_counts()# 去重分组统计df.index.where(df.index=='林*')# 筛选,查看是否由该行记录df.index.max()# 最大值df.index.map(lambdax:x+'_...
未来想要支持MapReduce, Spark,Storm等分布式计算框架 pd.read_parquet() 当DataFrame超过3GB时,建议选择parquet。文件越大,feather和parquet的读写效率差距越不明显。 备注 在测试时遇见一个奇怪的现象,dataframe进行sort_values操作后,按不同的列排序导出的parquet占用的磁盘空间有极大差别,但读取速度相同,目前尚未定位...
values:一组数据(ndarray类型) index:相关的数据索引标签 Series的创建 第一种:由列表或numpy数组创建 列表创建: Series([1,2,3,4,5],index=['a','b','c','d','e'],name='Hello') ndarray创建 a1 = np.array([1,2,3,4,5]) Series(a1,index=["a","b","c","d","e"],name='hello'...
Pandas中一共有三种数据结构,分别为:Series、DataFrame和MultiIndex(老版本中叫Panel )。 其中Series是一维数据结构,DataFrame是二维的表格型数据结构,MultiIndex是三维的数据结构。 1.2.1 Series Series是一个类似于一维数组的数据结构,它能够保存任何类型的数据,比如整数、字符串、浮点数等,主要由一组数据和与之相关的...
通过为 header 参数指定行位置列表,您可以读取列的 MultiIndex。指定非连续行将跳过介于其间的行。 In [211]: mi_idx = pd.MultiIndex.from_arrays([[1, 2, 3, 4], list("abcd")], names=list("ab")) In [212]: mi_col = pd.MultiIndex.from_arrays([[1, 2], list("ab")], names=list("...