分类与降维结合 PLS-DA在保留主成分分析(PCA)降维能力的基础上,通过引入组别标签信息,将数据投影到能够最大化组间差异的潜变量空间。这使得模型不仅能简化数据结构,还能提升分类准确性。模型评估体系完善 模型有效性通过R2X(解释变量X的变异度)、R2Y(解释响应变量Y的变异度)和Q2(预测能力)...
R2X和R2Y分别表示PLSDA分类模型所能够解释X和Y矩阵信息的百分比,Q2Y则为通过交叉验证计算得出,用以评价PLS-DA模型的预测能力,Q2Y越大代表模型预测效果较好。 关键数值参数提取:根据PLS-DA的建模结果,提取一系列关键数值并写入表格,并且进行进一步可视化。 得分矩阵,存储在结果文件“scoreMN.xls”中。 结果文件:得分...
箭头表示本OPLS-DA模型准确率所在的位置,其中R2X和R2Y分别表示所建模型对X和Y矩阵的解释率,Q2表示模型的预测能力,理论上R2、Q2数值越接近1说明模型越好,越低说明模型的拟合准确率越差,通常情况下,R2和Q2高于0.5较好,高于0.4即可以接受。
输出参数为 R2x:代谢组关联和正交部分对代谢组总变异的解释度 R2y:蛋白质组关联和正交部分对蛋白质组总变异的解释度 R2xcorr:代谢组关联部分对代谢组总变异的解释度 R2ycorr:蛋白质组关联部分对蛋白质组总变异的解释度 贡献度是指模型各部分对总变异的解释程度,用R2表示。R2值越高,表示该部分对模型的解释能力...
接着,进行PLS-DA建模。模型将输出关键参数结果,并记录在“plsda_result.txt”文件中。评价模型效果时,关注R2X、R2Y和Q2Y指标,接近1的数值表示模型拟合数据效果良好。R2X和R2Y分别衡量了模型解释X和Y矩阵信息的能力,而Q2Y用于评估预测能力。提取关键数值参数,生成得分矩阵和载荷矩阵,并进行VIP分析...
表1 PLS-DA模型的评价参数 注:表中A:表示主成分数;R2X:表示模型对X变量解释率;R2Y:表示模型对Y变量的解释率;Q2:表示模型预测能力。 四、差异代谢物筛选 ORIGINGENE 1) OPLS-DA模型得到的变量权重值(Variable Importance for the Projection, VIP)用于衡量各代谢物的表达模式对样本分类判别的影响强度和解释能力...
模型验证图 permutation test 的横坐标表示模型的准确率,纵坐标表示100次 permutation test 中100个模型的准确率的频数,箭头表示本OPLS-DA模型准确率所在的位置。其中R2X和R2Y分别表示所建模型对X和Y矩阵的解释率, Q2表示模型的预测能力,理论上R2、Q2数值越接近1说明模型越好,越低说明模型的拟合准确性越差。通常情...
结果中,R2X和R2Y分别表示所建模型对X和Y矩阵的解释率,Q2标示模型的预测能力,它们的值越接近于1表明模型的拟合度越好,训练集的样本越能够被准确划分到其原始归属中。 性别监督的PLS-DA模型。 左上图,展示了3个正交轴的R2Y和Q2Y。 由上图,PLS-DA模型的R2Y和Q2Y与随机置换数据后获得的相应值进行比较。
在偏最小二乘判别分析(PLS-DA)中,R2表示模型对数据的拟合程度,而Q2表示模型的预测能力。理想情况下,R2应该接近1,而Q2也应该是正值,越接近1越好。 在进行交叉验证时,R2和Q2的截距值可以帮助判断模型是否有过拟合的倾向。 R2截距(R2Y和R2X的截距)接近0更好,说明模型没有捕捉到随机噪声,而是真实反映了数据间的...
首先对第一主成分进行OPLS-DA建模分析,模型的质量用7折交叉验证(7-fold cross validation)进行检验;然后用交叉验证后得到的R2Y(模型对分类变量Y的解释度)和Q2(模型的预测性)对模型有效性进行评判;最后通过置换检验(permutation test),随机200次改变分类变量Y的...