PLS-DA(偏最小二乘判别分析)是一种结合降维与分类功能的多变量统计方法,适用于高维度数据的分组差异分析。其通过构建潜在变量最大化组间差异,并借助得分图、模型评估指标(如Q2)及变量权重值(VIP)实现数据可视化和关键变量筛选。以下从核心特点、应用场景及操作要点展开说明。
结果中,R2X和R2Y分别表示所建模型对X和Y矩阵的解释率,Q2标示模型的预测能力,它们的值越接近于1表明模型的拟合度越好,训练集的样本越能够被准确划分到其原始归属中。 性别监督的PLS-DA模型。 左上图,展示了3个正交轴的R2Y和Q2Y。 由上图,PLS-DA模型的R2Y和Q2Y与随机置换数据后获得的相应值进行比较。 左...
其中,R2X和R2Y:分别表示模型对自变量X和因变量Y的解释率;Q2是通过对模型进行交叉验证计算得出的,用以评价模型的预测能力,通常Q2> 0.5被认为是有效模型,Q2> 0.9则表示模型非常优秀。 表1 PLS-DA模型的评价参数 注:表中A:表示主成分数;R2X:表示模型对X变量解释率;R2Y:表示模型对Y变量的解释率;Q2:表示模型...
接着,进行PLS-DA建模。模型将输出关键参数结果,并记录在“plsda_result.txt”文件中。评价模型效果时,关注R2X、R2Y和Q2Y指标,接近1的数值表示模型拟合数据效果良好。R2X和R2Y分别衡量了模型解释X和Y矩阵信息的能力,而Q2Y用于评估预测能力。提取关键数值参数,生成得分矩阵和载荷矩阵,并进行VIP分析...
OPLS-DA分析中,S-plot图帮助识别与主成分和分类相关性强的代谢物,同时评估模型的R2X、R2Y和Q2值,反映模型对X和Y矩阵的解释率以及预测能力。验证图通过permutation test确定模型的最优性。要进行PCA、PLS-DA、OPLS-DA分析,可以使用如MetaboAnalyst这样的在线平台,它提供从数据预处理到模型构建和图形...
从图中可以看出Q2为0.994,R2Y为1,R2X为0.685,Q2和R2Y的P值均为0.005,说明permutation Test中只有1个随机分组模型结果优于本OPLS-DA模型,一般情况下P<0.05时模型较佳。 松哥统计说 R在生信领域可谓风风火火,R包中的ropls包可以进行PCA、PLS-DA和OPLS-DA分析。SIMCA-P 软件也可以进行OPLS-DA分析。具体实现...
首先对第一主成分进行OPLS-DA建模分析,模型的质量用7折交叉验证(7-fold cross validation)进行检验;然后用交叉验证后得到的R2Y(模型对分类变量Y的解释度)和Q2(模型的预测性)对模型有效性进行评判;最后通过置换检验(permutation test),随机200次改变分类变量Y的...
对于PLS-DA和OPLS-DA分析,结果中的R2X和R2Y分别表示所建模型对X和Y矩阵的解释率,Q2标示模型的预测能力,它们的值越接近于1表明模型的拟合度越好,训练集的样本越能够被准确划分到其原始归属中。 参考文献 【1】Chen Q, Liang X, Wu T, Jiang J, Jiang Y, Zhang S, Ruan Y, Zhang H, Zhang C, Chen...
在偏最小二乘判别分析(PLS-DA)中,R2表示模型对数据的拟合程度,而Q2表示模型的预测能力。理想情况下,R2应该接近1,而Q2也应该是正值,越接近1越好。 在进行交叉验证时,R2和Q2的截距值可以帮助判断模型是否有过拟合的倾向。 R2截距(R2Y和R2X的截距)接近0更好,说明模型没有捕捉到随机噪声,而是真实反映了数据间的...
显著性诊断(左上) :实际和模拟模型的R2Y和Q2Y值经随机排列后的散点图,模型R2Y和Q2Y(散点)大于真实值时(横线),表明产生过拟合 2 。Inertia(惯量)柱形图(右上) :通过展示累计解释率评估正交组分是否足够 离群点展示(左下) :通过scoreMN和loadingMN计算出各样本在投影平面及正交平面的坐标,...