df.filter(regex='regex') 选择列名匹配正则表达式的列; df.sample(n) 随机选择 n 行数据。实例 # 选择指定的列 df['column_name'] # 通过标签选择数据 df.loc[row_index, column_name] # 通过位置选择数据 df.iloc[row_index, column_index] # 通过标签或位置选择数据 df.ix[row_index, column_name...
df.filter(regex='^2',axis=0).filter(like='Q', axis=1) 7、按数据类型查询 df.select_dtypes(include=['float64']) # 选择float64型数据df.select_dtypes(include='bool')df.select_dtypes(include=['number']) # 只取数字型df.select_dtypes(exclude=['int'...
df.filter(regex='^2',axis=0).filter(like='Q', axis=1) 7、按数据类型查询 df.select_dtypes(include=['float64']) # 选择float64型数据 df.select_dtypes(include='bool') df.select_dtypes(include=['number']) # 只取数字型 df.select_dtypes(exclude=['int']) # 排除int类型 df.select_dty...
movie.select_dtypes(exclude=['int']).head() 5 rows × 25 columns 1.2.3 通过filter函数过滤选取多列 filter(items=None, like=None, regex=None, axis=None) items : list-like List of info axis to restrict to (must not all be present) ...
>>> # select columns by name >>> df.filter(items=['one', 'three']) one three mouse 1 3 rabbit 4 6 >>> # select columns by regular expression >>> df.filter(regex='e$', axis=1) one three mouse 1 3 rabbit 4 6 >>> # select rows containing 'bbi' >>> df.filter(like='bb...
filter(regex='\d').head() Out[10]: 代码语言:javascript 代码运行次数:0 运行 AI代码解释 # filter()函数,传递列表到参数items,选取多列 In[11]: movie.filter(items=['actor_1_name', 'asdf']).head() Out[11]: 2. 对列名进行排序 代码语言:javascript 代码运行次数:0 运行 AI代码解释 # 读取...
选择(Selection): df.select([..]), df.with_columns([..]) 过滤(Filtering): df.filter 分组/聚合(Group by / Aggregation): df.group_by(..).agg([..]) df = pl.DataFrame( { "nrs": [1,2,3, None,5], "names": ["foo","ham","spam","egg", None], ...
columns=['Python','Tensorflow','Keras'])#数据库连接conn = create_engine('mysql+pymysql://root:12345678@localhost/pandas?charset=UTF8MB4')#保存到数据库df.to_sql('score',#数据库中表名conn,#数据库连接if_exists='append')#如果表名存在,追加数据#从数据库中加载pd.read_sql('select * from ...
显然,item,like,regex是三种不同的过滤方式,因此不能同时出现。因此,按照索引过滤的方式一共有三种情况 df = pd.DataFrame(np.array(([1, 2, 3], [4, 5, 6])), index=['mouse', 'rabbit'], columns=['one', 'two', 'three']) df 根据列名筛选 # select columns by name df.filter(items=[...
df.filter( items=None, #list。和axis保持一致。 like=None, #正则表达式的匹配字符串 regex=None, #{"True","False"},是否用正则表达式匹配。 axis=None,#筛选轴依据,0是行索引,1是列索引筛选。 ) #这个函数下面讲两种用法,1)对行索引、列索引的筛选。2)类似于SQL中的group by之后使用having的筛选。