PLS是偏最小二乘分析,DA是判别分析。再加一个o就是加了一个正交,OPLS-DA就是正交偏最小二乘法判别分析。 当变量数量远大于样品数量时(行数小于列数), PLS或 PLS-DA模型容易过拟合,但是PCA效果也不好。但是加入正交矫正之后数据检出假阳性会降低,所以会更准确。数据处理的时候一般是先做PCA,然后做OPLS-DA。
PLS-DA是一种有监督的判别分析统计方法,通过建立代谢物表达量与样本类别之间的关系模型来实现对样品类别的预测。它类似于PCA,但在分析时必须对样品进行指定分组,这种模型计算的方法强行把各组分门别类,有利于发现不同组间的异同点。PLS-DA得分图展示了样本在第一主成分(t[1])和第二主成分(t[2])上的分布。不...
什么是PCA、PLS-DA、OPLS-DA ? 主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的无监督分析方法,是一种多变量统计分析方法,又称主分量分析。可以初步了解各组样本之间的总体代谢物差异和组内样本之间的变异度大小,并可通过分析QC样本进行质量控制。 偏最小二乘法判...
PLS-DA(偏最小二乘判别分析)及OPLSDA等模型,在组学分析领域中占据着举足轻重的地位,它们属于基于有监督学习的降维分析技术。模型构建完成后,为了确保其拟合度与预测准确性,通常需要借助一系列的检验手段。其中,置换检验已成为评估PLS-DA模型性能的一种不可或缺的方法。Y和Q2Y是置换检验中经常使用的两个参数,...
【统计检验】PLS-DA 偏最小二乘判别分析(Partial least squares Discriminant Analysis, PLS-DA)是一种统计学方法,通过投影分别将预测变量和观测变量投影到一个新空间,来寻找一个线性回归模型。通过建立组学数据与样本类别之间的关系模型,实现对样本类别的预测,为有监督的建模方式。 工具界面 接下来看看数据格式吧!需...
PLS-DA或OPLS-DA是一种有监督的判别分析统计方法。该方法运用PLS-DA建立代谢物表达量与样品类别之间的关系模型,来实现对样品类别的预测。分别建立两两分组比较的PLS-DA模型或OPLS-DA模型,模型得到的参数评价会以表格形式提供。其中R^2X和R^2Y分别表示所建模型对X和Y矩阵的解释率,Q2标示模型的预测能力,理论上R^...
R包ropls的PCA、PLS-DA和OPLS-DA 在代谢组学分析中经常可以见到主成分分析(PCA)、偏最小二乘判别分析(partial least-squares discrimination analysis,PLS-DA)、正交偏最小二乘判别分析(orthogonal partial least-squares discrimination analysis,OPLS-DA)等分析方法,目的为区分样本差异,或在海量数据中挖掘潜在标志物。
PLS-DA (Partial Least Squares Discriminant Analysis) 是一种多变量统计分析方法,常用于处理具有多个预测变量和多个响应变量的数据。在本文中,我们帮助客户使用了PLS-DA方法来挖掘两个疾病的不同中医分组方式下存在差异的指标。 首先,我们有两个Excel文件,分别是患者的证素数据。每一列代表一位患者的多个数据,不同颜...
PLS-DA/OPLS-DA建立了代谢物表达量与分组关系之间的模型,PLS-DA和OPLS-DA可以更好地获取组间差异信息,还可以对样品的分组进行预测,这是PCA做不到的。 图:PLS-DA得分图 如图是50例小鼠的血清样本。在PCA结果中,除了BCG组外,其他四组不能在PCA得分图中很好的区分开。进行了PLS-DA分析后,各组分离的情况有所...
数据经过PLS-DA分析后,会产生3张图片,分别是得分图、模型验证图、s-plot图,我们最常见到的则是得分图,因此在对得分图进行描述的时候也就相对比较简单,可以描述一下模型建立的一些参数(R2X、R2Y、Q2),以及得分图中的PC1和PC2,最后描述利用该模型进行差异代谢物筛选,挑出重点关注的差异代谢物即可啦。