Index可以是整数、标签或日期等,用于唯一地标识DataFrame中的每一行。DataFrame在创建时会自动分配默认的行索引,从0开始递增。这个默认的行索引可以通过属性 .index来访问和操作。示例:import pandas as pd# 创建一个DataFramedata = {'Name': ['John', 'Emma', 'Michael'],'Age': [
In [21]: sa.a = 5 In [22]: sa Out[22]: a 5 b 2 c 3 dtype: int64 In [23]: dfa.A = list(range(len(dfa.index))) # ok if A already exists In [24]: dfa Out[24]: A B C D 2000-01-01 0 0.469112 -1.509059 -1.135632 2000-01-02 1 1.212112 0.119209 -1.044236 2000-01...
Index(['one','two','three'],name='number')) result = data.stack() result 我们使用unstack()将数据的列旋转为行,默认是最里层的行索引: 代码语言:javascript 代码运行次数:0 运行 AI代码解释 result.unstack() 默认unstack是将最里层的行索引旋转为列索引,不过我们可以指定unstack的层级,unstack之后作为...
df.index.names # FrozenList(['year', 'month']) df.index.levels # FrozenList([[2012, 2013, 2014], [1, 4, 7, 10]]) (2)multiIndex的创建 arrays = [[1, 1, 2, 2], ['red', 'blue', 'red', 'blue']] pd.MultiIndex.from_arrays(arrays, names=('number', 'color')) # 结果...
(Not a Number) #空值 None #缺失值 pd.NaT #时间格式的空值# 判断缺失值 isnull()/isna() #断Series或DataFrame中是否包含空值 notnull() #与isnull()结果互为取反 isin() #判断Series或DataFrame中是否包含某些值 dropna() #删除Series或DataFrame中的空值 fillna() #填充Series或DataFrame中的空值 ffill...
df2 = pd.DataFrame({'A':[1,2,3]},index=[3,1,2])print(df1)print(df2) df1-df2#由于索引对齐,因此结果不是0 (4) 根据类型选择列 df.select_dtypes(include=['number']).head() (5) Series转换为DataFrame s = df.mean() s.to_frame() ...
可以通过shape,size,index,values等得到series的属性 可以使用s.head(),tail()分别查看前n个和后n个值 .unique()对Series元素进行去重 s = Series(data=[1,1,2,2,3,3,3,4,5,6,7,7,8,9,9,9]) s.unique() 当索引没有对应的值时,可能出现缺失数据显示NaN(not a number)的情况 ...
iloc()方法可以用 column 名和 index 名进行定位。 applymap()函数作用于 DataFrame 数据对象, 它会自动遍历 DataFrame 对象的所有元素, 并对每一个元素调用函数进行处理。 [例 9] applymap()函数的使用 程序清单如下。 #apply()函数使用案例# # 导入 numpy 库 import numpy as np # 导入 pandas 库 import...
df.groupby('name').apply(lambda x: x.sort_values('score', ascending=False)).reset_index(drop=True) 6.选择特定类型的列 drinks = pd.read_csv('data/drinks.csv') # 选择所有数值型的列 drinks.select_dtypes(include=['number']).head() # 选择所有字符型的列 drinks.select_dtypes(include=['...
Pandas是一种数据分析工具,是Python中非常流行的库之一,主要用于数据清洗、数据转换、数据分析和数据可视化。Pandas提供了两种重要的数据结构,分别是Series(一维的数据结构)和DataFrame(二维的数据结构)。 Pandas的功能包括: 数据导入和导出:支持从各种数据源中读取数据,如Excel、CSV、SQL等,同时也可以将数据导出到这些源...