df = df |> select(-`2023年`) |> pivot_longer(-(1:2), names_to = "年份", values_to = "平均工资") |> mutate(行业 = str_remove(行业, "\\.xls"), 年份 = parse_number(年份), 地区 = str_remove_all(地区, "市|省|自治区|.族|维吾尔")) df 4.3 批量计算基尼指数 有了整洁数据...
str_replace(string, pattern, replacement)str_replace_all(string, pattern, replacement)#string:需要处理的字符向量#pattern:指定匹配模#replacement:指定新的字符串用于替换匹配的模式#str_replace与str_replace_all的区别在于前者只替换一次匹配的对象,而后者可以替换所有匹配的对象 fruits <- c("one apple", ...
str_extract_all(x2,"o",simplify = T) #简化提取出来的数据位矩阵 image.png 8.字符删除 str_remove(x," ") #移除第一次出现的空格 str_remove_all(x," ") #移除所有空格 str_remove_all(x2,"th") #移除所有出现的th image.png 9.字符串替换 str_replace(x2,"o","A") #只替换第一次出现...
问题编号(点之前的数字)被捕获((\\d+)),整个列名被替换为该数字(regex捕获组1\\1)。
tidyverse包中有八个常用包,主要有ggplot2/tibble/tidyr/readr/purrr/dplyr/stringr/forcat,如果需要其他包,我们只能还是自己library。这个八个包也提供了我们一个学习的思路,反向学习,毕竟,学习R就是学习R包的过程。其次,就是tidyverse包也有其自身的含义在里面,tidy+verse就是整洁+转变,简单理解意思就是...
),整个列名被替换为该数字(regex捕获组1\\1)。如果省略.cols参数,则默认情况下将选择所有列。
str(a) 2. tidyr包2.1 gather函数 gather函数的功能和melt函数对应,但是语法要友好得多,非常有范儿,Hadley出品,必属精品。举个例子 table4a原本的1999和2000两个变量被转换成了新变量year的因子,原来的值被储存在新变量cases中。 2.2 spread函数 spread函数作用和gather相反,举例如下,经过gather和spread两个函数的...
remove 如果为TRUE,则从输出数据框中删除输入列 na.rm 如果为TRUE,则在合并数据之前删除缺失值 上面的案例我们将2列合并成了1列,那么如果我们的数据有20列也需要2列合并为一列,此时该如何操作,请继续往下看 data<-iris%>%select_if(is.numeric)result<-list();b<-2for(iin1:(data%>%ncol()/b)){resul...
str(a) 2. tidyr包 2.1 gather函数 gather函数的功能和melt函数对应,但是语法要友好得多,非常有范儿,Hadley出品,必属精品。举个例子 table4a原本的1999和2000两个变量被转换成了新变量year的因子,原来的值被储存在新变量cases中。 2.2 spread函数 spread函数作用和gather相反,举例如下,经过gather和spread两个函数的...
• str_detect(string, pattern, negate=FALSE): 检测是否存在匹配 • str_which(string, pattern, negate=FALSE): 查找匹配的索引 • str_count(string, pattern): 计算匹配的次数 • str_locate(string, pattern): 定位匹配的位置 • str_starts(string, pattern): 检测是否以pattern 开头 • str...