其实在绝大部分代谢组数据里面,我们的分组,都是不太可能在全局PCA里面区分开来,所以有基于正交信号校正的偏最小二乘判别分析(OPLS-DA) 来代替PCA,有点类似于我们前面的使用局部基因(免疫相关基因)后的PCA,它天然就可以把我们的生物学分组很好的区分开来。 首先在bioconductor有一个包mixOmics可以做 偏最小二乘判别...
实际上,这个过程在代谢组学数据里面就是OPLS-DA代替PCA,因为代谢组学矩阵即使我们有很明确的分组信息,它全局PCA通常是没办法像转录组表达量矩阵那样的成为一个三张图,详见:在生信技能树的教程:《你确定你的差异基因找对了吗?》 代谢组学数据多变量统计分析方法大致可以分为两类: 一类为非监督的学习方法,即在不...
ropls包可以实现PCA、PLS(-DA)和OPLS(-DA)方法,包括R2和Q2质量指标,VIP值的计算,检测异常值的分数和正交距离,以及许多图形(分数、加载、预测、诊断、异常值等)。 二、背景知识 偏最小二乘法(PLS)是一种基于预测器和因变量之间协方差的潜在变量回归方法,已被证明可以有效地处理多共线预测器的数据集,如光谱测量。
除了降维数据外,PLS-DA还可实现对样品类别的预测(即用于分类),通过构建分类预测模型,可进一步用于识别更多的样本所属,这是探索性的PCA方法无法做到的。 图中展示了PLS-DA用于构建分类模型,区分了受保护的猕猴和易感猕猴,平衡的交叉验证准确率为89.6%【3】...
PCA和PLS-DA分析表明,22RV1和LNcap之间存在显著的代谢差异(图H)。下调 LNcap 细胞(LNcap-siG 组)的 GLDC 基因表达后,PCA、PLS-DA 和 OPLS-DA 显示,与空载体(LNcap-NC)组相比,代谢模式发生了显著变化(图 I)。热图J显示了不同 GLDC 表达组前列腺癌细胞系代谢物的差异。路径分析显示,与 LNcap-...
1.主成分分析(PCA)图: 这是一种降维方法,用于展示数据的整体分布和结构。在PCA图中,每个点代表一个样本,相似的样本在图中的距离较近,而差异较大的样本距离较远。可以观察样品之间的聚类特点以及可能的离群点。 2.PLS-DA或OPLS-DA分析图: 这些方法也是降维方法,但与PCA不同的是,它们是监督学习方法。在这些图...
PLS-DA PLS-DA全称为偏最小二乘判别分析(Partial Least Squares Discriminant Analysis)。判别分析是一种根据观察或测量到的若干变量值,来判断研究对象如何分类的常用统计分析方法[2 ,3]。PLS-DA也能对数据进行降维,但与PCA不同的是,PLS-DA既分解自变量X矩阵...
一类为非监督的学习方法,即在不给定样本标签的情况下对训练样本进行学习,如PCA、非线性映射(NLM) 等; 另一类为有监督的学习方法,即在给定样本标签的情况下对训练样本进行学习,如偏最小二乘判别分析(PLS-DA) 、基于正交信号校正的偏最小二乘判别分析(OPLS-DA) 、人工神经网络(ANN) 、支持向量机(SVM) 等。其...
代谢组学数据分析中,最常用的多维模型包括主成分分析(principal component analysis, PCA)、偏最小二乘法判别分析(Partial least squares discriminant analysis, PLS-DA)和正交偏最小二乘法判别分析(orthogonal PLS-DA, OPLS-DA)。PCA属于无监督的分类模型,可将多维的数据不断降维形成几个主要成分(PC)来尽可能描述...
作者进一步对检测结果做了统计分析研究,PCA分析发现在一定程度上可以区分生鱼片和加工罗非鱼鱼片,且正离子模式优于负离子模式。OPLS-DA分析显示与生鱼片组相比,不同热加工处理对罗非鱼鱼片中代谢物的组成有较大的影响。根据差异代谢物筛选标准(VIP>1,p<0.05),与生鱼片组相比,在不同热加工处理的罗非鱼鱼片样品...