#新列的值new_col=np.random.randn(10)#在第三列位置插入新列,从0开始计算df.insert(2,'new_col',new_col)df 3. Cumsum Cumsum是pandas的累加函数,用来求列的累加值。 用法: DataFrame.cumsum(axis=None,skipna=True,args,kwargs) 参数作用: axis:index或者轴的名字 skipna:排除NA/null值 以前面的df...
axis:{0,1,...} 默认为0 表示连接的轴 join:{' inner ', ' outer '},默认为' outer '。如何处理其他轴上的索引。外为并,内为交 ignore_index:boolean,默认为False。如果为True,则不要使用连接轴上的索引值。生成的轴将被标记为0,…,n - 1。如果您正在连接对象,其中连接轴没有有意义的索引信息,则...
df.value_1.pct_change() 1. 9. Rank Rank是一个排名函数,按照规则(从大到小,从小到大)给原序列的值进行排名,返回的是排名后的名次。 比如有一个序列[1,7,5,3],使用rank从小到大排名后,返回[1,4,3,2],这就是前面那个序列每个值的排名位置。 用法: rank(axis=0,method:str='average',numeric_onl...
df1.index.union(df2.index) 在整个df中搜索关键字,类似ctrl+F loc = df.applymap(lambda x: 'keyword' in str(x)) #会return一个和df相同shape的bool matrix # 注意str(x) 之后结合df.any(axis=0/1) loc.any(axis=1) # index name, bool series loc.any(axis=0) # column name, bool series...
axis :计算方向,可以是 {0, 1, ‘index’, ‘columns’}中之一,默认为 0 interpolation(插值方法):可以是 {‘linear’, ‘lower’, ‘higher’, ‘midpoint’, ‘nearest’}之一,默认是linear。 这五个插值方法是这样的:当选中的分为点位于两个数数据点 i and j 之间时: ...
行索引,表明不同行,横向索引,叫index,0轴,axis=0 列索引,表名不同列,纵向索引,叫columns,1...
axis = 1 按 columns 排序, 左右排序 ascending 决定是升序还是降序,默认是升序 ascending = True 升序 ascending = False 降序 inplace 决定是否替代原数据, 默认为否 按索引排序 DataFrame.sort_index(axis = 0, ascending = Ture) axis决定是上下排序还是左右排序,默认为上下排序 ...
df3 = pd.concat([df, df2], axis=1) 时间序列处理 ⏰ 处理时间相关的数据: # 创建时间序列数据 dates = pd.date_range(m.jiaoputk.cn/Y/4896.PHP '2024-01-01', periods=100, freq='D') ts_df = pd.DataFrame({ '日期': dates, ...
df.iloc[1,2]=np.nan df.dropna(axis=0, how='any')) #丢弃只要含有nan的行,how={'any','all'},当axis=0时,all表示只有该行所有元素都为nan时才丢弃 df.fillna(value=0)) #将dataframe中的nan全部替换成0 df.isnull() #判断df中有没有缺失数据,返回bool型的dataframe ...
1.1.0 pyarrow: 0.13.0 xarray: None IPython: 7.0.1 sphinx: None patsy: None dateutil: 2.7.5 pytz: 2018.7 blosc: None bottleneck: None tables: None numexpr: None feather: None matplotlib: 2.2.3 openpyxl: None xlrd: None xlwt: None xlsxwriter: None lxml: None bs4: None html5lib: Non...