str_sub(string, -3,-2) <- 25; string str_subset()函数与word()函数的区别在于前者提取字符串的子串,后者提取的是单词,而且str_sub也可以其替换的作用。 3.3.3word, 从文本中提取单词(适用于英语环境下的使用) 函数定义:word(string, start = 1L, end = start, sep = fixed(" ")) 参数列表: str...
dcast(data,formula,fun.aggregate=NULL,sep="_",...,subset=NULL,margins=NULL,fill=NULL,drop=TRUE,value.var=guess(data),verbose=getOption("datatable.verbose")) data一个data.table; formula要铸造的表格的LHS~RHS格式;LHS和RHS可以是"..."和“.",其中"..."代表全部变量,"."代表无变量; fun.ag...
str_subset(string, pattern, negate=FALSE) 若negate = TRUE, 则返回不匹配的字符串。 str_subset(x, “p”) ## [1] “apple” “pear” 8.提取匹配的内容 str_extract(string, pattern) str_match(string, pattern) str_extract()只提取匹配的内容。 str_match()提取匹配的内容以及各个分组捕获,并返...
lm(formula=x~y,data,subset)——回归分析,x是因变量(响应变量),y是自变量(指示变量),formular=y~x是公式,其中若是有x^2项时,应把公式改写为y~I(x^2),subset为可选择向量,表示观察值的子集。例:lm(Y ~ X1 + X2 + I(X2^2) + X1:X2, data = data) predict(lm(y~x),new,interval=“predi...
tapply(X, INDEX, FUN, simplify = TRUE) ——处理分组数据, INDEX和X是有同样长度的因子,simplify是逻辑变(量默认为T) 代码语言:txt 复制 aggregate(x~y+z, data,FUN)和by()——和tapply功能类似 代码语言:txt 复制 其余参看: apply函数族 plyr库 ...
[1] "GNP.deflator" "GNP" "Unemployed" "Armed.Forces" "Population" "Year" "Employed" index<-grep("GNP",Names);index # 搜索含有字符串"GNP"的元素在向量Names中的位置 # [1] 1 2 Names[index] # 显示向量Names中由index标示的元素 # [1] "GNP.deflator" "GNP" # 3.字符串替换 # 将Names...
stringsAsFactors=FALSE) # subset函数获取数据子集 # 1)选择所有age>=35或者age<24的行,保留变量q1, q3和q5 new_df1 <- subset(leadership, age >= 35 | age < 24, select = c(q1, q2, q5)) new_df1 # 2)选择所有25岁以上的男性,保留gender到q5的变量集 new_df2 <- subset(leadership, gender ...
lm(formula=x~y,data,subset)——回归分析,x是因变量(响应变量),y是自变量(指示变量),formular=y~x是公式,其中若是有x^2项时,应把公式改写为y~I(x^2),subset为可选择向量,表示观察值的子集。例:lm(Y ~ X1 + X2 + I(X2^2) + X1:X2, data = data) predict(lm(y~x),new,interval=“predi...
1. sqlUpdate(channel, dat, tablename = NULL, index = NULL, 2. verbose = FALSE, test = FALSE, nastring = NULL, 3. fast = TRUE) 1. 2. 3. 更新已经存在的表格,需要包括已经存在的列。 ——— 二、sqldf包 本包的学习来自CDA DSC课程,L2-R语言第四讲内容,由常老师主讲。与RODBC的区别在于...
subset(<data>,<condition>,)——索引,<data>是数据,<condition>是索引条件,colnames指定索引列名 match(x,table,nomatch,incomparables)——匹配函数,返回x对应值在table中是否存在,并从1开始编号。x是查询对象,table是待匹配的向量,nomatch是不匹配项的设置值(默认为NA值),incomparables设置table表中不参加匹配的数...