如果数据很少,缺失值的个数直接可以数出来,比如上面的变量 height 只有一个缺失值。但是如果数据量很大,就需要借助函数 table( ) 了。 table(is.na(height)) # FALSE TRUE # 3 1 需要注意的是,任何包含 NA 的计算结果都是 NA。例如: mean(height) # <NA> 想要得到所有可参与计算的元素的平均值,应该...
如果数据很少,缺失值的个数直接可以数出来,比如上面的变量 height 只有一个缺失值。但是如果数据量很大,就需要借助函数table( )了。 table(is.na(height))# FALSE TRUE# 3 1 需要注意的是,任何包含 NA 的计算结果都是 NA。例如: mean(height)# <NA> 想要得到所有可参与计算的元素的平均值,应该先将 NA 从...
下面以变量 Sepal.Length 为例,用忽略缺失值后的均值替换该变量里的缺失值。先计算均值: Sepal.Length.Mean<-mean(iris.miss$Sepal.Length,na.rm=TRUE)Sepal.Length.Mean# 5.78695652173913# 用忽略缺失值后的均值替换该变量里的缺失值iris.miss1<-iris.miss iris.miss1$Sepal.Length[is.na(iris.miss1$Sepal....
如果数据很少,缺失值的个数直接可以数出来,比如上面的变量 height 只有一个缺失值。但是如果数据量很大,就需要借助函数 table( ) 了。 table(is.na(height)) # FALSE TRUE # 3 1 需要注意的是,任何包含 NA 的计算结果都是 NA。例如: mean(height) # <NA> 想要得到所有可参与计算的元素的平均值,应该先...
注意margins=1表行,2表列。2017.12.20日续接上文说实话这点我第一次阅读的时候总感觉不对,认为2表列应该计算的是每一列的数值,现在再来看发现很简单理解,首先2表示的列,在addmargins中就应该是添加2即添加一列。这一列必然是计算行得到的。 小结:table函数默认忽略缺失值,如果想要将缺失值视为一个类别需要设置...
如果数据很少,缺失值的个数直接可以数出来,比如上面的变量 height 只有一个缺失值。但是如果数据量很大,就需要借助函数 table( )了。 Plain Text 复制代码 9 1 2 3 table(is.na(height))# FALSE TRUE # 3 1 需要注意的是,任何包含 NA 的计算结果都是 NA 。例如: Plain Text 复制代码...
is.na(v1) x <- c(4,NA,6,NA) z <-daa.frame(x=x,y=y) z is.na(z) t1<- complete.cases(cre) t2 <- complete.cases(z) table(t1) table(t2) # 研究缺失值模式 library(mice) md.pattern(nhanes) library(VIM) aggr(nhanes, prop = T, numbers = T) ...
如果数据很少,缺失值的个数直接可以数出来,比如上面的变量 height 只有一个缺失值。但是如果数据量很大,就需要借助函数table( )了。 代码语言:javascript 复制 table(is.na(height))#FALSETRUE#31 需要注意的是,任何包含 NA 的计算结果都是 NA。例如: ...
table(a1$chemical) table(a1$chemical, useNA = "ifany") #求因子出现的频数;table()函数默认忽略缺失值(NA),要在频数统计中将NA视为一个有效的类别,请设定参数 useNA=“ifany” x = xtabs(air.hole ~ chemical + repeats, data = a1) #xtabs(forula,data)根据一个公式和一个矩阵或数据框创建一个...
注意table()函数默认忽略缺失值(NA) 。要在频数统计中将NA视为一个有效的类别,请设定参数useNA="ifany"。使用gmodels包中的CrossTable()函数是创建二维列联表的第三种方法。 CrossTable()函数仿照SAS中PROC FREQ或SPSS中CROSSTABS的形式生成二维列联表。示例参阅代码清单...