PLS-DA(偏最小二乘判别分析)是一种结合降维与分类功能的多变量统计方法,适用于高维度数据的分组差异分析。其通过构建潜在变量最大化组间差异,并借助得分图、模型评估指标(如Q2)及变量权重值(VIP)实现数据可视化和关键变量筛选。以下从核心特点、应用场景及操作要点展开说明。
主页> 问答中心> 代谢组学FAQ汇总> PLS-DA/OPLS-DA二维图中q2为负值是什么意思 在PLS-DA(偏最小二乘判别分析)或OPLS-DA(正交偏最小二乘判别分析)的二维图中,q²值(Q-squared)衡量的是模型对数据的交叉验证预测效果,理想的q²值应接近1。q²值为负表示模型的预测能力较差,通常意味着模型未能有效地捕...
其中,R2X和R2Y:分别表示模型对自变量X和因变量Y的解释率;Q2是通过对模型进行交叉验证计算得出的,用以评价模型的预测能力,通常Q2> 0.5被认为是有效模型,Q2> 0.9则表示模型非常优秀。 表1 PLS-DA模型的评价参数 注:表中A:表示主成分数;R2X:表示模型对X变量解释率;R2Y:表示模型对Y变量的解释率;Q2:表示模型...
其中R2X和R2Y分别表示所建模型对X和Y矩阵的解释率, Q2表示模型的预测能力,理论上R2、Q2数值越接近1说明模型越好,越低说明模型的拟合准确性越差。通常情况下 , R2、Q2高于0.5较好,高于0.4即可接受。 从图中可以看出Q2为0.994 , R2Y为1 , R2X为0.685 , Q2和R2Y的P值均小于0.01,说明 permutation test 中随...
PLS-DA(Partial Least Squares Discriminant Analysis)和OPLS-DA(Orthogonal Partial Least Squares Discriminant Analysis)中的 Q2 值为负数通常表示模型的预测能力不佳。Q2值是一种交叉验证参数,用于评估模型的预测能力。当Q2值为负数时,意味着模型的预测误差比随机模型还要大。要提高模型的预测能力,您可以考虑调整以下...
为了深入探索桂花细胞液在不同温度和时间条件下的香气成分差异,并验证这些差异的可靠性,研究采用了偏最小二乘判别分析(PLS-DA)模型。该模型通过一系列严格的验证步骤,确保了结果的准确性和可靠性。首先,模型通过排列检验进行了200次的交叉验证,这一过程中,Q2回归线与纵轴的相交点小于零(R2=0.369, Q2=-0.826),这...
在caret包中,可以使用train函数来训练PLS-DA模型,并使用trainControl函数来设置交叉验证的参数。通过设置summaryFunction参数为"twoClassSummary",可以计算出PLS-DA模型的R2和Q2。 另外一个包是pls包,它是一个专门用于偏最小二乘回归和偏最小二乘判别分析的包。在pls包中,可以使用plsr函数来训练PLS-DA模型,并使用sum...
PLS-DA或OPLS-DA是一种有监督的判别分析统计方法。该方法运用PLS-DA建立代谢物表达量与样品类别之间的关系模型,来实现对样品类别的预测。分别建立两两分组比较的PLS-DA模型或OPLS-DA模型,模型得到的参数评价会以表格形式提供。其中R^2X和R^2Y分别表示所建模型对X和Y矩阵的解释率,Q2标示模型的预测能力,理论上R^...
R2X和R2Y分别表示PLSDA分类模型所能够解释X和Y矩阵信息的百分比,Q2Y则为通过交叉验证计算得出,用以评价PLS-DA模型的预测能力,Q2Y越大代表模型预测效果较好。 关键数值参数提取:根据PLS-DA的建模结果,提取一系列关键数值并写入表格,并且进行进一步可视化。 得分矩阵,存储在结果文件“scoreMN.xls”中。 结果文件:得分...
从图中可以看出Q2为0.994,R2Y为1,R2X为0.685,Q2和R2Y的P值均为0.005,说明permutation Test中只有1个随机分组模型结果优于本OPLS-DA模型,一般情况下P<0.05时模型较佳。 松哥统计说 R在生信领域可谓风风火火,R包中的ropls包可以进行PCA、PLS-DA和OPLS-DA分析。SIMCA-P 软件也可以进行OPLS-DA分析。具体实现...