# we have automagically already created an index (in the first section) In [531]: i = store.root.df.table.cols.index.index In [532]: i.optlevel, i.kind Out[532]: (6, 'medium') # change an index by passing new parameters In [533]: store.create_table_index("df", optlevel=9...
read_excel(), read_sql()等函数可从各种文件和数据库中导入数据to_csv(), to_excel(), to_sql()等函数可将数据导出到文件或数据库数据清洗和预处理:处理缺失值: isnull(), fillna(), dropna()
data.median(axis=0) open 21.44 high 21.97 close 10.00 low 20.98 volume 83175.93 price_change 0.05 p_change 0.26 turnover 2.50 dtype: float64 (4)idxmax()、idxmin() # 求出最大值的位置 data.idxmax(axis=0) open 2015-06-15 high 2015-06-10 close 2015-06-12 low 2015-06-12 volume 2017...
pd.read_csv("stock_day2.csv", names=["open","high","close","low","volume","price_change","p_change","ma5","ma10","ma20","v_ma5","v_ma10","v_ma20","turnover"]) 2.写入CSV文件:datafram.tocsv() DataFrame.to_csv(path_or_buf=None,sep=',',columns=None,header=True,in...
data_city_price['自增长率']=data_city_price['12月'].pct_change(fill_method='ffill')#.apply(lambda x:format(x,'.2%')) df=data_city_price df 查看图表数据属性,其中"7月"、"增长率"、"自增长率"这三列数据类型都是字符型,而且都有缺失值。
代码语言:javascript 代码运行次数:0 运行 AI代码解释 In [47]: pd.set_option("large_repr", "info") In [48]: df Out[48]: <class 'pandas.core.frame.DataFrame'> RangeIndex: 10 entries, 0 to 9 Data columns (total 10 columns): # Column Non-Null Count Dtype --- --- --- --- 0...
例子:header=0,header=None(无列名) names: 指定列名。 例子:names=['A', 'B', 'C'] index_col: 指定哪一列作为行索引。 默认值是 None。 例子:index_col=0 skiprows: 跳过前几行数据。 例子:skiprows=3(跳过前 3 行) usecols: 指定要读取的列。 例子:usecols=['A', 'B'] 或 usecols=...
data['收盘价(元)'].pct_change() #以5个数据作为一个数据滑动窗口,在这个5个数据上取均值 df['收盘价(元)'].rolling(5).mean() 数据修改 # 删除最后一行 df = df.drop(labels=df.shape[0]-1) # 添加一行数据['Perl',6.6] row = {<!-- -->'gr...
pandas.DataFrame.at 是一个用于访问和设置 DataFrame 单个值的方法。它基于行和列标签进行访问,通常比 loc 更快,因为 at 专门用于单个元素的访问。本文主要介绍一下Pandas中pandas.DataFrame.at方法的使用。 DataFrame.at 访问行/列标签对的单个值。 与loc类似,两者都提供基于标签的查找。如果只需要获取或设置DataFra...
df['涨跌幅_计算'] = df['收盘价'].pct_change(-1)#类似于diff,但是求的是两个数直接的比例,相当于求涨跌幅 十二、cum(cumulative)类函数 df['成交量_cum'] = df['成交量'].cumsum()#该列的累加值print(df[['成交量','成交量_cum']])print((df['涨跌幅'] + 1.0).cumprod())#该列的累乘...