1、Pandas 数据结构 DataFrame2、Pandas 时间序列之 Timedelta3、从pandas DataFrame对象创建HTML分析报告4、从pandas DataFrame对象创建HTML分析报告5、Pandas on AWS6、Pandas 简介
df = df.set_index('date') # 将date设置为index print(df.head(2)) print(df.tail(2)) print(df.shape) number date 2013-10-24 3 2013-10-25 4 number date 2017-02-14 6 2017-02-22 6 (425, 1) df的行数一共是425行。 查看Dataframe的数据类型 print(type(df)) print(df.index) print...
1.2 Pandas的DataFrame对象 1.3 Pandas的Index对象 2、数据取值与选择 2.1 Series数据选择方法 2.2 DataFrame数据选择方法 DataFrame在有些方面像二维或结构化数组,在有些方面又像一个共享索引的若干Series对象构成的字典。 3、Pandas数值运算方法 3.1 通用函数:保留索引 3.2 通用函数:索引对齐 python运算符与pandas方法的...
print(df.loc['12/12/2016'])#选取指定的某一行,读取的数据是Series类型print(df.loc['13/12/2016':'06/12/2016'])#选取在此范围内的多行,和在list中slice操作类似,读取的数据是DataFrame类型print(df.loc[:,'股票代码':'收盘价'])#选取在此范围内的多列,读取的数据是DataFrame类型print(df.loc['13...
df['month']=df['datetime'].dt.month df['day']=df['datetime'].dt.day # 输出提取后的DataFrame print("\n提取年月日后的DataFrame:\n",df) 在上面的代码中,我们首先创建了一个包含日期字符串的DataFrame,然后使用to_datetime函数将其转换为datetime类型的新列。接着,通过dt属性,我们提取了年、月、日...
默认情况下,返回的 Series 中显示了 DataFrame 索引的内存使用情况,可以通过传递 index=False 参数来抑制索引的内存使用情况: In [10]: df.memory_usage(index=False) Out[10]: int64 40000 float64 40000 datetime64[ns] 40000 timedelta64[ns] 40000 complex128 80000 object 40000 bool 5000 categorical 9968...
但一般建议直接用切片(slice),这样更为直观,方便 # dataframe的truncate函数可以获取某个时期之前或之后的数据,或者某个时间区间的数据 # 但一般建议直接用切片(slice),这样更为直观,方便 print('---获取某个时期之前或之后的数据---') print('---after---...
2、DataFrame.sort_values(by, ascending=True, inplace=False) Merge主键的连接 merge连接用how 数据合并 连接用join模式 pandas.concat(objs, axis=0, join='outer', ignore_index=False) 数据分组聚合 df.groupby() 分层索引 【重要知识】在选择数据时: 重复值 df.drop_duplicated(subset=None,keep=“first...
print(series_with_index) 3. 基本操作和属性 3.1 访问元素 3.2 切片操作 4. 常用方法 4.1 统计方法 4.2 过滤操作 通过学习以上基础知识和代码实例,读者将对Pandas中的Series对象有了更深入的理解。这只是Pandas功能的冰山一角,后续我们将继续深入学习DataFrame、数据清理、合并等更高级的主题。
我有以下dataframe: i = pd.date_range('2018-04-09', periods=4, freq='1D20min') ts = pd.DataFrame({'A': [1, 2, 3, 4], 'B':i}) ts['date'] = pd.to_datetime(ts['B']).dt.date ts['time'] = pd.to_datetime(ts['B']).dt.time ts = ts.drop('B', axis = 1) ...