在工程项目中,我们如果直接使用Pandas的方法pd.read_csv('file.csv')和pd.read_excel('file.xlsx')方法,这两个方法返回的数据就是DataFrame类型的数据,接下来我们来看看使用其他的方法如何进行DataFrame数据的创建。 1. 使用字典创建DataFrame 使用字典创建DataFrame是非常方便的,使用的方式如下: import pandas as pd...
out = df.groupby(['col0','name'], as_index=False).agg(col1=('col1','min'), col2=('col1','max')) 以另一种方式使用相同的代码: out = df.groupby(['col0','name'])['col1'].agg(['min','max']).set_axis(['col1','col2'], axis=1).reset_index() Output: col0 name ...
data[['open', 'close']].apply(lambda x: x.max() - x.min(), axis=0) open 22.74 close 22.85 dtype: float64 5 小结 算术运算【知道】 逻辑运算【知道】 1.逻辑运算符号 2.逻辑运算函数 对象.query() 对象.isin() 统计运算【知道】 1.对象.describe() 2.统计函数 3.累积统计函数 自定义运算...
忽略NaN:可以使用DataFrame的max()、min()和mean()函数,它们会自动忽略NaN值并计算非NaN值的最大值、最小值和平均值。例如: 代码语言:txt 复制 import pandas as pd df = pd.DataFrame({'A': [1, 2, np.nan], 'B': [3, np.nan, 5]}) max_value = df['A'].max() min...
3.4 min() max() --- 求最值 # 生成一个 6 行 3 列的数组data = np.floor(np.random.normal(85, 3, (6,3)))df = pd.DataFrame(data)print(df)print()# 默认计算每列的最值print(df.max())print(df.min())print()# axis 可以指定计算的方向,默认 axis=0 计算每列的最值print(df.max...
找出最大值和最小值是常见的分析步骤,下面扩展了DataFramePretty类,增加一个min_max_cols属性, 用来标记需要高亮最大最小值的列。 classDataFramePretty(object):def__init__(self, df: pd.DataFrame, min_max_cols=[]) ->None: self.data = df ...
1.组建方法——pd.DataFrame pd.DataFrame(data=None, index=None, columns=None) data= 数据 index= 索引,即行名、行表头 columns= 列名、列表头 使用前要执行前面的import pandas as pd 2.用字典型数据组建——pd.DataFrame 方法基本同上,因为字典型自...
DataFrame提供了丰富的聚合函数和统计方法,可以对数据进行汇总和计算。这些函数可以帮助你快速得到数据的统计信息,为进一步的分析提供支持。示例代码为:# 计算年龄列数据的平均值、最大值、最小值等统计信息 df['age'].mean() # 计算平均值 df['age'].max() # 计算最大值 df['age'].min() ...
DataFrame.sum() 返回每列的和。 DataFrame.mean() 返回每列的平均值。 DataFrame.median() 返回每列的中位数。 DataFrame.min() 返回每列的最小值。 DataFrame.max() 返回每列的最大值。 DataFrame.std() 返回每列的标准差。 DataFrame.var() 返回每列的方差。 DataFrame.count() 返回每列的非缺失值数量...
#我们可以通过DataFrame对象的方法: # mean、max、min、std、var等方法分别获取每个学生或每门课程的平均分、最高分、最低分、标准差、方差等信息, # 也可以直接通过describe方法直接获取描述性统计信息 print(df.mean()) print(df.mean(axis=1)) # axis=1表示按行计算 print(df.var()) # 方差 print(df...