利用dplyr包中的函数更高效的数据清洗、数据分析,及为后续数据建模创造环境;本篇涉及到的函数为filter、filter_all()、filter_if()、filter_at()、mutate、group_by、select、summarise。 1、数据筛选函数: #可使用filter()函数筛选/查找特定条件的行或者样本 #filter(.data=,condition_1,condition_2)#将返回相匹...
(2)filter_if():满足条件的列范围内,选择行 从字符列范围内,选择包含 NA 的行: sw_dup%>% filter_if(is.character,any_vars(is.na(.))) (3)filter_at():在某些列范围内,选择行 在包含 "Sepal" 的列范围内,选择存在值 > 4 的行: ...
iris%>%as_tibble()%>%filter(.,(Species=="setosa"&Sepal.Length>=5)|(Species%in%c("versicolor","virginica"))) 删除Species中含有NA的行 iris%>%filter(!is.na(Species)) 跨多列过滤 filter_all() 过滤所有列 filter_if()需要一个返回的布尔值以指示要过滤列的类型。如果是符合条件则将遵循这些列...
filter_if(.tbl, .predicate, .vars_predicate, .preserve = FALSE) # .predicate参数:表示通过逻辑向量判断哪些列参与筛选,然后根据筛选条件筛选。 1. 2. 用法: mydata % filter_if(is.integer, all_vars(. > 0)) # 通过is.integer参数指定数据集中整数型的列参与筛选,筛选条件为所有整数型列的数值大于0...
其操作逻辑为在所选的列范围内,根据条件做出判断,得到多列的逻辑值,再借助all语句合成一个逻辑变量用于filter()筛选行。 #筛选出4-6列中所有值大于76的行 > df %>% + filter(if_all(4:6,~.x > 76)) # A tibble: 2 x 8 class name sex chinese math english moral science ...
利用dplyr包中的函数更高效的数据清洗、数据分析,及为后续数据建模创造环境;本篇涉及到的函数为filter、filter_all()、filter_if()、filter_at()、mutate、group_by、select、summarise。 1、数据筛选函数: #可使用filter()函数筛选/查找特定条件的行或者样本 ...
filter_if函数(一般用于使用者想对数据集中的符合条件的列进行转换,然后进行观测值的筛选时)。 代码语言:javascript 代码运行次数:0 复制Cloud Studio 代码运行 > b <- mtcars[1:8,1:8] > b mpg cyl disp hp drat wt qsec vs Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 Mazda RX4 Wag 21.0 ...
filter_at(mtcars, vars(starts_with("d")), any_vars((. %% 2) == 0)) 2、数据分组、汇总函数group_by、summarise 其他延展函数 group_by_all、group_by_if、group_by_at(将在后续文章中解析) group_by函数按照某个变量分组,对于数据集本身并不会发生什么变化,只有在与mutate(), arrange() 和 summa...
temp[,i]<-filter(data[i]/7, rep(1, 7)) } yatmdata<-data.frame(temp) 代码利用matrix先定义一个181*31的空值矩阵,然后往里面灌数字。 2、switch分支语句 ##switch分支语句 switch(1,mean(1:10),rnorm(4)) #执行mean(1:10) switch(2,mean(1:10),rnorm(4)) #执行rnorm(4) ...
score1%>%right_join(student,by="学号")%>%filter(if_any(2:4,is.na))%>%select(-(2:4)) 更稳妥的做法是从课程表出发,用下面的结果表代替score1: course%>%left_join(score,by="课程编号")%>%select(-c(课程编号,教师编号))%>%pivot_wider(names_from=课程名称,values_from=成绩) ...