在caret包中,可以使用train函数来训练PLS-DA模型,并使用trainControl函数来设置交叉验证的参数。通过设置summaryFunction参数为"twoClassSummary",可以计算出PLS-DA模型的R2和Q2。 另外一个包是pls包,它是一个专门用于偏最小二乘回归和偏最小二乘判别分析的包。在pls包中,可以使用plsr函数来训练PLS-DA模型,并使用sum...
PLS-DA(偏最小二乘判别分析)是一种结合降维与分类功能的多变量统计方法,适用于高维度数据的分组差异分析。其通过构建潜在变量最大化组间差异,并借助得分图、模型评估指标(如Q2)及变量权重值(VIP)实现数据可视化和关键变量筛选。以下从核心特点、应用场景及操作要点展开说明。
首先,模型通过排列检验进行了200次的交叉验证,这一过程中,Q2回归线与纵轴的相交点小于零(R2=0.369, Q2=-0.826),这一关键指标直接证明了PLS-DA模型的稳健性和可靠性。此外,Q2和R2的数值虽然看似不直观的高相关性,但实际上在模型验证中,Q2的负值表明模型在预测未知样本时能够有效避免过拟合,从而增强了结果的可靠性...
交叉验证:R2是相关性系数,表示这个模型的拟合性好不好,是一个定量的测量(范围0-1),意味着所建立的模型能在多大程度上代表真实的数据,一般当R2在0.7,0.8表示模型解释能力较好。Q2表示PLS-DA模型的预测效果,一般Q2大于0.5表示预测能力较好,并且R2与Q2的值应该比较接近。 模型验证图permutation test的横坐标表示模型的...
模型质量评估标准包括R2X、R2Y和Q2这三个指标,这些指标越接近1表示模型拟合数据效果越好。其中,R2X和R2Y:分别表示模型对自变量X和因变量Y的解释率;Q2是通过对模型进行交叉验证计算得出的,用以评价模型的预测能力,通常Q2> 0.5被认为是有效模型,Q2> 0.9则表示模型非常优秀。
在caret包中,可以使用train函数来训练PLS-DA模型,并使用trainControl函数来设置交叉验证的参数。通过设置summaryFunction参数为"twoClassSummary",可以计算出PLS-DA模型的R2和Q2。 另外一个包是pls包,它是一个专门用于偏最小二乘回归和偏最小二乘判别分析的包。在pls包中,可以使用plsr函数来训练PLS-DA模型,并使用sum...
在偏最小二乘判别分析(PLS-DA)中,R2表示模型对数据的拟合程度,而Q2表示模型的预测能力。理想情况下,R2应该接近1,而Q2也应该是正值,越接近1越好。 在进行交叉验证时,R2和Q2的截距值可以帮助判断模型是否有过拟合的倾向。 R2截距(R2Y和R2X的截距)接近0更好,说明模型没有捕捉到随机噪声,而是真实反映了数据间的...
评价(O)PLS-DA模型拟合效果使用R2X、R2Y和Q2Y这三个指标,这些指标越接近1,表示PLS-DA模型拟合数据效果越好。 R2X和R2Y分别表示PLSDA分类模型所能够解释X和Y矩阵信息的百分比,Q2Y则为通过交叉验证计算得出,用以评价PLS-DA模型的预测能力,Q2Y越大代表模型预测效果较好。 关键数值参数提取:根据PLS-DA的建模结果,...
由上图,PLS-DA模型的R2Y和Q2Y与随机置换数据后获得的相应值进行比较。 左下图,展示了各样本在投影平面内以及正交投影面的距离,具有高值的样本标注出名称,表明它们与其它样本间的差异较大。颜色代表性别分组。 右下图,各样本在PLS-DA轴中的坐标,颜色代表性别分组。我们可以看到,相对于上文的PCA(仅通过方差特征...
OPLS-DA分析中,S-plot图帮助识别与主成分和分类相关性强的代谢物,同时评估模型的R2X、R2Y和Q2值,反映模型对X和Y矩阵的解释率以及预测能力。验证图通过permutation test确定模型的最优性。要进行PCA、PLS-DA、OPLS-DA分析,可以使用如MetaboAnalyst这样的在线平台,它提供从数据预处理到模型构建和图形...