通过观察图1,我们可以更直观地了解模型在预测方面的实际效果。SIMCA-P软件用于PLS-DA结果分析,通过观察置换检验结果来判断模型预测效果。◇ ropls工具应用 此外,若采用R包ropls进行PLS-DA分析,将呈现类似上图所示的结果。R包ropls提供的PLS-DA分析结果中,除了展示R2Y及Q2的截距,还会给出pR2Y及pQ2,即R2Y和Q...
PLS-DA(偏最小二乘判别分析)是一种结合降维与分类功能的多变量统计方法,适用于高维度数据的分组差异分析。其通过构建潜在变量最大化组间差异,并借助得分图、模型评估指标(如Q2)及变量权重值(VIP)实现数据可视化和关键变量筛选。以下从核心特点、应用场景及操作要点展开说明。
评价(O)PLS-DA模型拟合效果使用R2X、R2Y和Q2Y这三个指标,这些指标越接近1,表示PLS-DA模型拟合数据效果越好。 R2X和R2Y分别表示PLSDA分类模型所能够解释X和Y矩阵信息的百分比,Q2Y则为通过交叉验证计算得出,用以评价PLS-DA模型的预测能力,Q2Y越大代表模型预测效果较好。 关键数值参数提取:根据PLS-DA的建模结果,...
结果中,R2X和R2Y分别表示所建模型对X和Y矩阵的解释率,Q2标示模型的预测能力,它们的值越接近于1表明模型的拟合度越好,训练集的样本越能够被准确划分到其原始归属中。 性别监督的PLS-DA模型。 左上图,展示了3个正交轴的R2Y和Q2Y。 由上图,PLS-DA模型的R2Y和Q2Y与随机置换数据后获得的相应值进行比较。 左...
表1 PLS-DA模型的评价参数 注:表中A:表示主成分数;R2X:表示模型对X变量解释率;R2Y:表示模型对Y变量的解释率;Q2:表示模型预测能力。 四、差异代谢物筛选 ORIGINGENE 1) OPLS-DA模型得到的变量权重值(Variable Importance for the Projection, VIP)用于衡量各代谢物的表达模式对样本分类判别的影响强度和解释能力...
接着,进行PLS-DA建模。模型将输出关键参数结果,并记录在“plsda_result.txt”文件中。评价模型效果时,关注R2X、R2Y和Q2Y指标,接近1的数值表示模型拟合数据效果良好。R2X和R2Y分别衡量了模型解释X和Y矩阵信息的能力,而Q2Y用于评估预测能力。提取关键数值参数,生成得分矩阵和载荷矩阵,并进行VIP分析...
模型验证图 permutation test 的横坐标表示模型的准确率,纵坐标表示100次 permutation test 中100个模型的准确率的频数,箭头表示本OPLS-DA模型准确率所在的位置。其中R2X和R2Y分别表示所建模型对X和Y矩阵的解释率, Q2表示模型的预测能力,理论上R2、Q2数值越接近1说明模型越好,越低说明模型的拟合准确性越差。通常情...
从图中可以看出Q2为0.994,R2Y为1,R2X为0.685,Q2和R2Y的P值均为0.005,说明permutation Test中只有1个随机分组模型结果优于本OPLS-DA模型,一般情况下P<0.05时模型较佳。 松哥统计说 R在生信领域可谓风风火火,R包中的ropls包可以进行PCA、PLS-DA和OPLS-DA分析。SIMCA-P 软件也可以进行OPLS-DA分析。具体实现...
在偏最小二乘判别分析(PLS-DA)中,R2表示模型对数据的拟合程度,而Q2表示模型的预测能力。理想情况下,R2应该接近1,而Q2也应该是正值,越接近1越好。 在进行交叉验证时,R2和Q2的截距值可以帮助判断模型是否有过拟合的倾向。 R2截距(R2Y和R2X的截距)接近0更好,说明模型没有捕捉到随机噪声,而是真实反映了数据间的...
首先对第一主成分进行OPLS-DA建模分析,模型的质量用7折交叉验证(7-fold cross validation)进行检验;然后用交叉验证后得到的R2Y(模型对分类变量Y的解释度)和Q2(模型的预测性)对模型有效性进行评判;最后通过置换检验(permutation test),随机200次改变分类变量Y的...