Now, we can standardize our data frame using the dplyr package as shown below: data_scale2<-data%>%# Applying functions of dplyrmutate_at(c("x1","x2"), ~(scale(.)%>%as.vector))head(data_scale2)# Head of scaled data# x1 x2# 1 -1.2764344 -0.433002745# 2 -1.2523528 1.058137478#...
总共有62个特征,然后我的结局是同样长度的一个2分类的向量,此时我要进行一个lasso回归筛选一下到底取哪些特征可以更好地预测我的结局,我可以写出如下代码:cv.lasso <- cv.glmnet(x, y, family='binomial', alpha=1, parallel=TRUE, standardize=TRUE, type.measure='auc')plot(cv.lasso)运行代码后可以出...
standardize:逻辑值,是否在拟合模型前对自变量进行标准化,默认是TRUE。 下面是一个对不同观测自定义权重的示例。 我们这个示例中,样本量是100,所以我们为100个观测自定义以下权重: # 简单定义一下,前50个是1,后50个是2 wts <- c(rep(1,50), rep(2,50)) fit1 <- glmnet(x, y, alpha = 0.2, weight...
scale(x, center=TRUE, scale=TRUE) column center or standardize a matrix. 编辑 仿真数据 set.seed(936757) # Create example data data <- data.frame(x1 = runif(100), x2 = runif(100)) head(data) # Head of example data # x1 x2 # 1 0.1455930 0.4151339 # 2 0.1524390 0.8134210...
use the scale() function to z-score standardize a data frame confirm that the transformation was applied correctly create training and test datasets re-classify test cases try several different values of k 原理解释 kNN算法将特征处理为一个多维特征空间(feature space)内的坐标。由于我们的数据集只包含...
x.Age) # 原始数据长这样: data <- data.frame(x.Age, x.Gender, Smoke, CVD) head(data) ...
data<-data.frame(x.Age,x.Gender,Smoke,CVD) head(data) ## x.Age x.Gender Smoke CVD ## 1 51 0 1 0 ## 2 50 0 0 0 ## 3 29 0 0 0 ## 4 28 0 0 0 ## 5 3 0 0 0 ## 6 56 0 1 1 首先可以看一下原始数据的基线资料表,用的是tableone这个包,之前也做过介绍,做基线资料表...
save – Save R data objects as RData workspace file. save.image – Save global R environment as RData workspace file. saveRDS – Save single R data object as RData workspace file. scale – Standardize data. scale_colour_brewer [ggplot2] – Change color palette in ggplot2 plot. scale_fil...
data=data.complete, distance='logit', method='nearest', replace=FALSE, ratio = 1) 1. 2. 3. 4. 5. 6. 通过summary()查看匹配前后,不同组间协变量的各种统计量。通常建议选择standardize = TRUE查看标准后的各协变量的平衡性指标: summary(m.out,standardize = TRUE) ...
standardize <- function(x) { (x - mean(x)) / sd(x) } aggregate(score ~ name + age, data, standardize) ``` 这个代码表示要对data数据集中的score列进行聚合操作,并按照name和age进行分组。在FUN参数中,我们使用自定义的standardize函数对每个组的score进行标准化操作。 3. 对时间序列数据进行聚合操...