select函数用于选择变量 第一个参数为数据框,后续参数为要选择的变量名: select(mtcars, mpg, drat) 变量名前加负号表示反向选择: # 选择除mpg, drat外的其他变量 select(mtcars, -c(mpg, drat)) filter函数根据一定条件筛选样本 第一个参数为数据框,第二个参数为逻辑表达式: ...
select(3,7,9) %>% head(n =10) 2)用运算符确定目标列 用:选择连续的若干列 用!选择变量集合的余集 &和|选择变量的交集或者并集 c合并多个选择 代码演示 mpg %>% select(year:drv) %>% head(n =10) mpg %>% select(!year:drv) %>% head(n =10) mpg %>% select(c(year, drv, hwy)) ...
1filter 系列#筛选满足条件的样本(cases),上一篇文章已经讲解 2select系列#筛选满足条件的变量 3mutate 系列#生成新的变量 4summarise 系列#概括数据集信息 5join系列#关联函数,同SQL中的join select 函数:仅保留你所需要的变量,并支持修改变量名称 用法:select(.data, ...) 与之前讲解的filter有所不同,select是...
select 函数:仅保留你所需要的列,并支持修改变量名称 用法:select(.data, …) 与之前讲解的filter有所不同,select是筛选变量的,而filter是筛选样本集。 应用场景:假设数据存于宽表中(比如有100个变量的表),而你仅需要其中几个变量。而select的关键在于”…“的判断条件 #mtcars数据集中,筛选mpg、cyl、wt、vs,...
dplyr包:筛选功能(filter),排列功能(arrange),选择功能(select),变形功能(mutate),汇总功能(summrise),分组功能(group_by) library(dplyr) library(tibble) ###将过长的数据整理成友好的tibble数据 mtcars_df1 <- as_tibble(mtcars) head(mtcars_df1) #...
利用dplyr包中的函数更高效的数据清洗、数据分析,及为后续数据建模创造环境;本篇涉及到的函数为filter、filter_all()、filter_if()、filter_at()、mutate、group_by、select、summarise。 1、数据筛选函数: #可使用filter()函数筛选/查找特定条件的行或者样本 #filter(.data=,condition_1,condition_2)#将返回相匹...
利用dplyr包中的函数更高效的数据清洗、数据分析,及为后续数据建模创造环境;本篇涉及到的函数为filter、filter_all()、filter_if()、filter_at()、mutate、group_by、select、summarise。 1、数据筛选函数: #可使用filter()函数筛选/查找特定条件的行或者样本 ...
另一个函数top_n还实现了min_rank和filter的组合,用以筛选按排序显示的数据框。 1.2.3 select变量选择 对于一个稍微了解SQL或者更多的数据分析师来说,select自然是再熟悉不过的一个单词了,这里的select在某种程度上也类似于SQL中的select,其功能是按变量名选择数据框中的变量。
filter(mtcars, cyl == 4 & gear == 3)注意: 表示 AND 时要使用 & 而避免 && 按列筛选:select select()用列名作参数来选择子数据集。dplyr包中提供了些特殊功能的函数与select函数结合使用,用于筛选变量,包括starts_with,ends_with,contains,matches,one_of,num_range和everything等。用于重命名时,...
筛选: filter() dplyr包安装及载入,使用datasets包中的mtcars数据集做演示,首先将过长的数据整理成友好的tbl_df数据: install.packages("dplyr") library(dplyr) mtcars_df= tbl_df(mtcars) 按给定的逻辑判断筛选出符合要求的子数据集 注意:只能将指定条件的观测筛选出来,为了弥补这个缺陷,可以使用select()函数筛选...