df[]行操作 df[]列操作 df[]按条件取值 df.iloc[],通过行数和列数,取结果 df.iloc[]行操作 df.iloc[]列操作 df.iloc[]行、列同时操作 df.loc[],通过index名称和列名,取结果 df.loc[]行操作 df.loc[]列操作 df.loc[]行、列同时操作 df.loc[]按条件取值 df.ix[],有坑,已弃用,了解一下就行...
之前我们学习了如何对DataFrame进行切片,其中df.loc[]可以按某列条件筛选行数据,本章我们就拓展一下df.loc[]按某列条件筛选行数据,内容如下: (1)df.loc[]按某列条件筛选行数据。 (2)df.loc[]按某列条件筛选并修改行数据。 (3)筛选条件常用:判断某列数据中是否包含特定字符串(或字符串列表)。
同样的,我们测试一下 df.loc 添加行的性能 start=time.perf_counter()df=pd.DataFrame({"seq":[...
df=pd.read_csv(data_path_2,encoding='gbk') # 这里因为我是用Excel保存的csv,所以编码格式是gbk, 大部分时候使用UTF-8 1. 2. 3. 2.1 查询单个值 通常情况下,使用df.loc()时,只要传入行列名即可返回要查询的值,比如:我们需要查询 2020/7/28 的天气,可以通过:df.loc['2020-7-28','天气']来查询,...
但是这种方式有一个限制,就是后面只能传入一个切片,而不能是一个整数。比如我想要单独查询第2行,我们通过df[2]来查询是会报错的。因为pandas会混淆不知道我们究竟是想要查询一列还是一行,所以这个时候只能通过iloc或者是loc进行。 逻辑表达式 和numpy一样,DataFrame也支持传入一个逻辑表达式作为查询条件。
df.loc[["A","D"]] # loc取不连续多行 # 输出结果为: W X Y Z A 0 1 2 3 D 12 13 14 15 df.iloc[0] # iloc取单行 # 输出结果为: W 0 X 1 Y 2 Z 3 Name: A, dtype: int32 df.iloc[1:3] # iloc取连续多行 # 输出结果为: ...
用df.va lue s 读取数据的前提是必须知道学生及科目的位置,非常麻烦 。而 df.loc 可直接通过行、列标题读取数据,使用起来更为方便 。 使用df.loc 的语法为: 行标题或列标题若是包含多个项目,则用小括号将项目括起来,项目之间以逗 号分隔,如“( ” 数学 ” , ” 自然 ”) ”;若要包含所有项目,则用冒...
df.loc["C","Y"] # loc取单行单列,即为某一个坐标的值 # 输出结果为: 10 df.loc["A":"C","X":"Z"] # loc取连续多行多列 # 输出结果为: X Y Z A 1 2 3 B 5 6 7 C 9 10 11 df.loc[["A","C","E"],["W","Y"]] # loc取不连续多行多列 # 输出结果为: W Y A 0...
前面我们讲了R批量下载B细胞和T细胞受体VDJ序列文件,那么如何将这些fasta序列读到R里面,方便后面处理呢...
多列---")print(df.loc['2010-01-01':'2010-01-04',['a','b']])#loc是闭区间,尾部包含print(df.iloc[:4,[0,1]])#iloc是开区间,尾部不包含print(df.ix[:4,['a','b']])#ix 是开区间,尾部不包含print(df.loc[df.index<'20100105',['a','b']])#loc 第一个参数可以用条件提取 结果...