units(cholesterol) < - 'mg/dl' # uses units.default in Hmiscunits(blood.pressure) < - 'mmHg'# Specify population model for log odds that Y=1L < - .4*(sex=='male') + .045*(age-50) + (log(cholesterol - 10)-5.2)*(-2*(sex=='female') + 2*(sex=='male')) +...
# 将变量名合成有意的名称named <- function(x) { rr <- paste(x[2], x[1], "-", x[3], sep = "") chartr("()", "of", rr)}sapply(splitNames, named) ## [1] "meanoftBodyAcc-X" "meanoftBodyAcc-Y" "meanoftBodyAcc-Z" ## [4] "stdoftBodyAcc-X" "stdoftBodyAcc-Y" "...
summary()——描述统计摘要,和 Hmisc()包的describe()类似,会显示NA值,四分位距是第1个(25%取值小于该值)和第3个四分位数(75%取值小于该值)的差值(50%取值的数值),可以衡量变量与其中心值的偏离程度,值越大则偏离越大。 table(<datafame>$)——统计datafame数据中属性变量var的数值取值频数(NA会自动去掉...
detach("package:Hmisc", unload = TRUE) 获得分组区间后,我们只需要将区间的因子重命名就成功的实现了数据的离散化。 数据的汇总 对数据进行汇总,分类汇总是我们也比较常用的,比如对行或列求和,求均值,求分位数: data ## [,1] [,2] [,3] [,4] ## [1,] 1 5 9 13 ## [2,] 2 6 10 14 #...
summary()——描述统计摘要,和 Hmisc()包的describe()类似,会显示NA值,四分位距是第1个(25%取值小于该值)和第3个四分位数(75%取值小于该值)的差值(50%取值的数值),可以衡量变量与其中心值的偏离程度,值越大则偏离越大。 table(<datafame>$)——统计datafame数据中属性变量var的数值取值频数(NA会自动去掉...
It’s also possible tocombine correlogram with the significance test. We’ll use the resultres.cor2generated in the previous section withrcorr() function [inHmiscpackage]: # Insignificant correlation are crossed corrplot(res2$r, type="upper", order="hclust", p...
2、 function(x, = FALSE) ifx - x!(x) m - mean(x)n - length(x) s - sd(x)skew - sum(x - m)A3/sA3)/n kurt - sum(x - m)A4/sA4)/n - 3 return(c(n = n, mean = m, stdev = s, skew = skew, kurtosis = kurt)sapply(mtcarsvars, mystats)3、 describe() :Hmisc 包...
summary()——描述统计摘要,和 Hmisc()包的describe()类似,会显示NA值,四分位距是第1个(25%取值小于该值)和第3个四分位数(75%取值小于该值)的差值(50%取值的数值),可以衡量变量与其中心值的偏离程度,值越大则偏离越大。 table(<datafame>$)——统计datafame数据中属性变量var的数值取值频数(NA会自动去掉...
Hmisc包中的rcorr函数可同时返回相关系数,以及pvalue 简单版本 #rcorr(x, type = c("pearson","spearman"))##代码还是非常简单library("Hmisc")## Loading required package: lattice## Loading required package: survival## Loading required package: Formula## Loading required package: ggplot2### Attaching...
bwplot(size~a1,data,panel=panel.bpplot,prob=seq(.01,.49,by=.01),datadensity=TRUE,ylab=)——Hmisc包的分位箱图 earth.count(na.omit(x),number=4,overlap=1/5)——连续变量x的离散化,把x转化为因子类型;number设置区间个数,overlap设置两个区间靠近边界的重合?每个区间的观测值相等 earth.count(na...