样本的结果可视化可能是更常见的PCA图形,通过fviz_pca_ind()实现: fviz_pca_ind(pca.res) 这个图是通过res.ind$coord里面的坐标实现的,其实就是不同样本在不同主成分的上面的得分score。 默认的可视化比较简陋,但是可以通过超多参数实现各种精细化的控制,比如把不同的属性映射给点的大小和颜色,实现各种花里胡哨...
res.pca$ind # 包含所有样本的输出结果的矩阵列表 #get_pca_ind(res.pca) # 可以使用factoextra包的函数提取样本输出数据。 res.pca$ind$coord # 样本在PC的坐标=左奇异值/sqrt(eig) res.pca$ind$cos2 # 样本坐标的平方/样本Euclid(L2)范数的平方(标准化数据)。 ## 未标准化数据,样本1的cos2=ind1....
get_pca_ind(res.pca),get_pca_var(res.pca): 分别提取个体和变量的结果。 fviz_pca_ind(res.pca),fviz_pca_var(res.pca): 分别可视化结果个体和变量。 fviz_pca_biplot(res.pca):制作个人和变量的双标图。 在接下来的部分中,我们将说明这些功能中的每一个。 特征值/方差 如前几节所述,特征值衡量每...
get_pca_ind(res.pca),get_pca_var(res.pca):分别提取个体和变量的结果。 fviz_pca_ind(res.pca),fviz_pca_var(res.pca):分别可视化结果个体和变量。 fviz_pca_biplot(res.pca):制作主成分分析散点图biplot图。 我们检查特征值以确定考虑的主成分的数量。可以使用函数get_eigenvalue提取主成分保留的特征值...
get_pca_ind(res.pca),get_pca_var(res.pca) fviz_pca_ind(res.pca),fviz_pca_var(res.pca) fviz_pca_biplot(res.pca) library(factoextra)eig.val<-get_eigenvalue(res.pca)eig.val## eigenvalue variance.percent cumulative.variance.percent## Dim.1 4.124 41.24 41.2## Dim.2 1.839 18.39 59.6#...
pca.res <- PCA(iris[,-5], graph = F, scale.unit = T) # 简简单单1行代码实现主成分分析 pca.res ## **Results for the Principal Component Analysis (PCA)** ## The analysis was performed on 150 individuals, described by 4 variables ...
使用get_pca_ind()提取样本结果,和变量结果类似: res.ind <- get_pca_ind(pca.res)head(res.ind$coord) ## Dim.1 Dim.2 Dim.3 Dim.4## 1 -2.264703 0.4800266 -0.12770602 -0.02416820## 2 -2.080961 -0.6741336 -0.23460885 -0.10300677## 3 -2.364229 -0.3419080 0.04420148 -0.02837705## 4 -2.29938...
pca_var_contrib 以上均是对变量在PCA中的分析,下面则是观测值的分析 跟上述变量的分析一样,先用提取出individuals信息,会发现也有coord,cos2和contrib等信息 > ind <- get_pca_ind(res.pca) > ind Principal Component Analysis Results for individuals === Name Description 1 "$coord" "Coordinates for t...
大多数用于PCA分析的R包都默认执行中心化,例如FactoMineR包,只让我们选择是否标准化,在它们的函数里设置scale=TRUE就可以执行标准化了,而无需我们提前算好。 (2)降维 降维过程是PCA的核心过程,需要计算特征向量(eigenvector)和特征值(eigenvalue)。特征向量与特征值总是成对出现,这是线性代数的概念,这里不再赘述。
R语言PCA分析教程 Principal Component Methods in R(代码下载) 主成分分析Principal Component Methods(PCA)允许我们总结和可视化包含由多个相互关联的定量变量描述的个体/观察的数据集中的信息。每个变量都可以视为不同的维度。如果数据集中包含3个以上的变量,那么可视化多维超空间可能非常困难。