select(3,7,9) %>% head(n =10) 2)用运算符确定目标列 用:选择连续的若干列 用!选择变量集合的余集 &和|选择变量的交集或者并集 c合并多个选择 代码演示 mpg %>% select(year:drv) %>% head(n =10) mpg %>% select(!year:drv) %>% head(n =10) mpg %>% select(c(year, drv, hwy)) ...
select函数用于选择变量 第一个参数为数据框,后续参数为要选择的变量名: select(mtcars, mpg, drat) 变量名前加负号表示反向选择: # 选择除mpg, drat外的其他变量 select(mtcars, -c(mpg, drat)) filter函数根据一定条件筛选样本 第一个参数为数据框,第二个参数为逻辑表达式: ...
2.1 筛选(subset vs. filter/select/rename) 2.2 排序(order vs. arrange) 2.3 转换(transform vs. mutate/transmute) 2.4 分组与概括(group_by/summarise) 3. 数据框重塑(base vs. dplyr) 3.1 数据框的合并(rbind/cbind vs. bind_rows/bind_cols) 3.2 数据框的关联(merge vs. *_ join) 3.3 数据框的...
1filter 系列#筛选满足条件的样本(cases),上一篇文章已经讲解 2select系列#筛选满足条件的变量 3mutate 系列#生成新的变量 4summarise 系列#概括数据集信息 5join系列#关联函数,同SQL中的join select 函数:仅保留你所需要的变量,并支持修改变量名称 用法:select(.data, ...) 与之前讲解的filter有所不同,select是...
filter(mtcars, cyl == 4 & gear == 3)注意: 表示 AND 时要使用 & 而避免 && 按列筛选:select select()用列名作参数来选择子数据集。dplyr包中提供了些特殊功能的函数与select函数结合使用,用于筛选变量,包括starts_with,ends_with,contains,matches,one_of,num_range和everything等。用于重命名时,...
用法:select(.data, …) 与之前讲解的filter有所不同,select是筛选变量的,而filter是筛选样本集。 应用场景:假设数据存于宽表中(比如有100个变量的表),而你仅需要其中几个变量。而select的关键在于”…“的判断条件 #mtcars数据集中,筛选mpg、cyl、wt、vs,4个变量数据#mtcars[,c("mpg","cyl","wt","vs"...
用法:select(.data, …) 与之前讲解的filter有所不同,select是筛选变量的,而filter是筛选样本集。 应用场景:假设数据存于宽表中(比如有100个变量的表),而你仅需要其中几个变量。而select的关键在于”…“的判断条件 #mtcars数据集中,筛选mpg、cyl、wt、vs,4个变量数据 ...
利用dplyr包中的函数更高效的数据清洗、数据分析,及为后续数据建模创造环境;本篇涉及到的函数为filter、filter_all()、filter_if()、filter_at()、mutate、group_by、select、summarise。 1、数据筛选函数: #可使用filter()函数筛选/查找特定条件的行或者样本 ...
筛选: filter() 排列: arrange() 选择: select() 变形: mutate() 汇总: summarise() 分组: group_by() 以及tidyr包的下述四个函数用法: gather—宽数据转为长数据; spread—长数据转为宽数据; unit—多列合并为一列; separate—将一列分离为多列; ...
5.1 筛选: filter 5.2 排列: arrange 5.3 选择: select 5.4 变形: mutate 5.5 汇总: summarise 5.6 分组: group_by 6 tidyr包的下述四个函数用法 6.1 宽数据转为长数据:gather (excel透视表反向操作) 6.2 长数据转为宽数据:spread (excel透视表功能) ...