Numberoftrees:100No.ofvariables tried at each split:2OOBestimateoferror rate:3.33%Confusion matrix:setosa versicolor virginicaclass.error setosa50000.00versicolor04730.06virginica02480.04 代码解读:randomForset,执行建模,x参数设定自变量数据集,y参数设定因变量数据列,importance设定是否输出因变量在模型中的重要性,...
armd.tm1<-attr(armd.mf1, "terms")class(armd.tm1) ## [1]"terms""formula" terms对象的属性中保存公式和模型框的重要信息, 其属性有: names(attributes(armd.tm1)) ## [1]"variables""factors""term.labels""order""intercept"## [6]"response""class"".Environment""predvars""dataClasses" attr(a...
str(veteran) ## 'data.frame': 137 obs. of 8 variables: ## $ trt : num 1 1 1 1 1 1 1 1 1 1 ... ## $ celltype: Factor w/ 4 levels "squamous","smallcell",..: 1 1 1 1 1 1 1 1 1 1 ... ## $ time : num 72 411 228 126 118 10 82 110 314 100 ... ## $...
## Compute the averages for the variables in 'state.x77', grouped## according to the region (Northeast, South, North Central, West) that## each state belongs to.aggregate(state.x77, list(Region = state.region), mean)## Compute the averages according to region and the occurrence of more...
GKtauData(cat_variables) plot(dataset) 可以看出,关于因变量的变异性,预测因素的解释力非常小。换句话说,根据Goodman和Kruskal's tau度量,我们的预测因素和因变量之间几乎没有关联。这可以从TenYearCHD一栏的数值中看出。 假设我的G&Ktau检验正确的话,这对模型来说并不是一个好消息。
# Create variables a <- c(1,2,3,4,5,6,7,8,9) b <- list(x = LifeCycleSavings[,1], y = LifeCycleSavings[,2]) 吐槽一下, 我对R比较顶不顺的一点就是整天有一堆这种dataset, 还TM内置的, 也可能是需要额外install的, 但是别人例程就这么bia到你面前, 这啥, 这tm又是啥? 当然了, 好奇...
h <- formula("y ~ x1 + x2") 简单! 如何连接公式 要将多个公式粘合或组合在一起, 你有两个选择。首先, 你可以为每个公式创建单独的变量, 然后使用list(): # Create variables i <- y ~ x j <- y ~ x + x1 k <- y ~ x + x1 + x2 ...
# 4 variables and 50 observations. plot(, type="lines") loadings( # Loadings: # Comp.1 Comp.2 Comp.3 Comp.4 # Murder 0.536 0.418 0.341 0.649 # Assault 0.583 0.188 0.268 -0.743 # UrbanPop 0.278 -0.873 0.378 0.134
glm(formula ,family = binomial(link = "logit")) 解释 从上面的总结输出中,我们可以看到,性别对学生留级的概率有正向和显著的预测,而学前教育则有负向和显著的预测。具体来说,与女孩相比,男孩更有可能留级。以前上过学的学生不太可能导致留级。 为了解释参数估计值,我们需要对估计值进行指数化处理。