14 - 分组转换| transform 在原数据框 df 新增一列,数值为该区的平均薪资水平 df['平均薪资'] = df[['district','salary']].groupby(by='district').transform('mean') 15 - 分组过滤|filter 提取平均工资小于 30000 的行政区的全部数据 df.groupby('district').filter(lambda x:x['salary'].mean()...
df.filter(items=['Q1', 'Q2']) # 选择两列df.filter(regex='Q', axis=1) # 列名包含Q的列df.filter(regex='e$', axis=1) # 以e结尾的列df.filter(regex='1$', axis=0) # 正则,索引名以1结尾df.filter(like='2', axis=0) # 索引中有2的# 索引...
特别是 DataFrame.apply()、DataFrame.aggregate()、DataFrame.transform() 和DataFrame.filter() 方法。 在编程中,通常的规则是在容器被迭代时不要改变容器。变异将使迭代器无效,导致意外行为。考虑以下例子: In [21]: values = [0, 1, 2, 3, 4, 5] In [22]: n_removed = 0 In [23]: for k, ...
apply()将一个函数作用于DataFrame中的每个行或者列 df = df2.filter(regex='[^a-z]', axis=1).apply(lambda x: x*2) Applymap() 将函数做用于DataFrame中的所有元素(elements) 例如,在所有元素前面加个字符A def addA(x): return "A" + str(x) df.applymap(addA) 4.3 独热编码与随机抽样 ...
df.filter(items=['Q1', 'Q2']) # 选择两列 df.filter(regex='Q', axis=1) # 列名包含Q的列 df.filter(regex='e$', axis=1) # 以e结尾的列 df.filter(regex='1$', axis=0) # 正则,索引名以1结尾 df.filter(like='2', axis=0) # 索引中有2的 # 索引中以2开头、列名有Q的 df.fil...
DataFrame.filter([items, like, regex, axis])过滤特定的子数据框 DataFrame.first(offset)Convenience method for subsetting initial periods of time series data based on a date offset. DataFrame.head([n])返回前n行 DataFrame.idxmax([axis, skipna])Return index of first occurrence of maximum over re...
df.filter(items=['Q1','Q2'])# 选择两列df.filter(regex='Q', axis=1)# 列名包含Q的数据,返回dataframedf.filter(regex='1$', axis=0)# 正则, 索引名包含1的df.filter(like='2', axis=0)# 索引中有2的,返回dataframe# 索引中2开头列名有Q的df.filter(regex='^2', axis=0).filter(like='...
df.filter(regex='e$', axis=1) # 以e结尾的列 df.filter(regex='1$', axis=0) # 正则,索引名以1结尾 df.filter(like='2', axis=0) # 索引中有2的 # 索引中以2开头、列名有Q的 df.filter(regex='^2',axis=0).filter(like='Q', axis=1) ...
na_filter, verbose, skip_blank_lines, parse_dates, infer_datetime_format, keep_date_col, date_parser, dayfirst, iterator, chunksize, compression, thousands, decimal, lineterminator, quotechar, quoting, escapechar, comment, encoding, dialect, tupleize_cols, error_bad_lines, warn_bad_lines, skipf...
其中DataFrame(data=None,index=None,columns=None)其中index代表行名称,columns代表列名称 其中df.index/df.columns分别代表行名称与列名称: 代码语言:javascript 代码运行次数:0 运行 AI代码解释 df.index #行名 df.columns #列名 其中index也是索引,而且不是那么好修改的。