pfun<-function(n,p0){k<-0:n;mu.val<-n*p0 sd.val<-sqrt(n*p0*(1-p0))index<-sign(k-mu.val)p.true<-pbinom(k,n,p0)p.norm<-pnorm(k,mu.val,sd=sd.val)p.adjnorm<-pnorm(k-0.5*index,mu.val,sd=sd.val)p.adjnorm0<-pnorm(k+0.5,mu.val,sd=sd.val)p.adjnorm1<-pnorm(k...
在默认情况下,抽样时我们无需对此进行转换:index就能很好体现这个样本就是随机抽样了。
1.2 Hosmer-Lemeshow拟合优度指标 Hosmer和Lemeshowv于1989年研制出了一种对于Logistic回归模型拟合优度检验方法,称为Hosmer-Lemeshow拟合优度指标。记为HL,HL检验根据预测概率值将数据大致分为相同规模的10个组,不考虑协变类型个数,将观测数据按照其预测概率做升序排列。 通过皮尔逊 来概括这些分组中事件结果的观测数和...
在使用很多时间序列模型的时候,如 ARMA、ARIMA,都会要求时间序列是平稳的,所以一般在研究一段时间序列的时候,第一步都需要进行平稳性检验,除了用肉眼检测的方法,另外比较常用的严格的统计检验方法就是ADF检验,也叫做单位根检验。 ADF检验全称是 Augmented Dickey-Fuller test,顾名思义,ADF是 Dickey-Fuller检验的增广形...
index <- order(medians) x <- factor(x, levels(x)[index]) } groups <- levels(x) k <- length(groups) # summary statistics stats <- function(z)(c(N = length(z), Median = median(z), MAD = mad(z))) sumstats <- t(aggregate(y, by=list(x), FUN=stats)[2]) ...
#Behrens-Fisher 检验(npmc 包),非参数多重比较 BF_test <- npmc(dat, df = 2, alpha = 0.05) BF <- BF_test$test$BF BF结果如下图所示,可以看出是group1内每个小组和小组之间value1的统计检验结果,pvalue在p.value.2s中,只不过每个小组用的1,2,3对应的index顺序。
第3列(N)是模型含有预测变量的个数,第2列(Index)是先按第3列升序排列后,自变量相同个数的模型中在按照信息准则的大小进行排列,在plot作图中用于标识模型。在进行模型比较时,R^2、校正的R^2越大,Cp值越小模型越佳。 本例涉及模型较多,为更直观的显示结果,我们可以使用图示进行结果显示。
library(vcd)library(xlsx)data<-read.xlsx("DiseaseData.xlsx",sheetIndex=1)head(data) 性别以及发病部位与两种病的关系用卡方独立检验: 代码语言:javascript 复制 a<-xtabs(~class+sex,data)b<-xtabs(~class+part,data)chisq.test(a)chisq.test(b) ...
# 分割数据集set.seed(21)trainIndex <- sample(1:nrow(数据), 0.8 * nrow(数据))训练数据 <- 数据[trainIndex, ]测试数据 <- 数据[-trainIndex, ]# 建立初始模型初始模型 <- lm(销售额 ~ ., data = 训练数据)summary(初始模型)lm(formula = 销售额 ~ ., data = 训练数据)Residuals: Min...
均衡性检验 2.R语言复现 2.1数据集拆分 导入整理好的lung.cancer数据集,共14个自变量,2个结局变量。按照7:3的比例将数据集拆分为训练集train和验证集test。 ###设置随机种子###set.seed(1111)#数字随机index<-sort(sample(nrow(lung.cancer),nrow(lung.cancer)*.7))train<-lung.cancer[index,]#70%数据集...