R中的dplyr包提供了一系列用于数据处理和转换的函数。其中,mutate_if函数可以根据指定的条件对数据框中的多个列进行变换。 mutate_if函数的语法如下: 代码语言:txt 复制 mutate_if(.tbl, .predicate, .funs, ...) 参数说明: .tbl:要进行变换的数据框。 .predicate:一个函数或谓词,用于选择要进行变换的列。
warpbreaks%>%mutate(breed=if_else(wool=="A",true="Merino",false="Corriedale"))%>%sample_frac(size=0.15) 2.多类别情形:case_when() 用case_when() 做更多条件下的替换,避免使用很多 if_else() 嵌套。 warpbreaks%>%mutate(tension=case_when(tension=="H"~"High",tension=="M"~"Medium",tens...
使用dplyr的mutate函数创建条件伪变量。在这个例子中,我们将根据分数的不同,创建一个名为grade的条件伪变量: 代码语言:txt 复制 data <- data %>% mutate(grade = ifelse(score >= 90, "A", ifelse(score >= 80, "B", "C"))) 在上述代码中,我们使用了两个ifelse语句来创建条件伪变量grade。...
利用dplyr包中的函数更高效的数据清洗、数据分析,及为后续数据建模创造环境;本篇涉及到的函数为filter、filter_all()、filter_if()、filter_at()、mutate、group_by、select、summarise。 1、数据筛选函数: #可使用filter()函数筛选/查找特定条件的行或者样本 #filter(.data=,condition_1,condition_2)#将返回相匹...
mutate(y = ifelse(y < 3 | y > 20, NA, y)) 和R 一样,ggplot2 也遵循不能无视缺失值的原则。因为无法明确地绘制出缺失值,所以 ggplot2 在绘图时会忽略缺失值,但会提出警告以通知缺失值被丢弃了。 ggplot(data = diamonds2) + + geom_point(aes(x = x, y = y)) ...
今天继续介绍dplyr包中的重要函数mutate,其基本功能为创建新列;mutate中的选项几乎是无穷无尽的,可以通过各种函数之间的组合来对数据集做任意的处理,下面通过具体的案例来进行演示 这次我们使用R内置的数据集msleep,其中包括哺乳动物的睡眠时间。让我们首先加载包并查看数据: ...
利用dplyr包中的函数更高效的数据清洗、数据分析,及为后续数据建模创造环境;本篇涉及到的函数为filter、filter_all()、filter_if()、filter_at()、mutate、group_by、select、summarise。 1、数据筛选函数: #可使用filter()函数筛选/查找特定条件的行或者样本 ...
na_if(), coalesce() if_else(), recode(), case_when() 另注意:mutate添加新变量并保留原变量;而transmute扔掉原始变量。 同时与之比较相关的函数有mutate_all(),mutate_at(),mutate_if() 类似的有:transmute_all(),transmute_at(),mutate_if() ...
if_else(),, 分组标题 由于变异表达式是在组内计算的,因此它们可能会在分组的 tibbles 上产生不同的结果。一旦涉及聚合、滞后或排名函数,就会出现这种情况。比较这个未分组的变异: starwars %>% select(name, mass, species) %>%mutate(mass_norm = mass / mean(mass, na.rm =TRUE)) ...
library(dplyr) 接下来我们可以使用dplyr包中提供的函数来进行数据操作。以下是一些常用的dplyr函数: filter():用于筛选数据 arrange():用于对数据进行排序 select():用于选择变量 mutate():用于新增变量 summarise():用于计算汇总统计量 group_by():用于按照分组变量分组 ...