在caret包中,可以使用train函数来训练PLS-DA模型,并使用trainControl函数来设置交叉验证的参数。通过设置summaryFunction参数为"twoClassSummary",可以计算出PLS-DA模型的R2和Q2。 另外一个包是pls包,它是一个专门用于偏最小二乘回归和偏最小二乘判别分析的包。在pls包中,可以使用plsr函数来训练PLS-DA模型,并使用sum...
在偏最小二乘判别分析(PLS-DA)中,R2表示模型对数据的拟合程度,而Q2表示模型的预测能力。理想情况下,R2应该接近1,而Q2也应该是正值,越接近1越好。 在进行交叉验证时,R2和Q2的截距值可以帮助判断模型是否有过拟合的倾向。 R2截距(R2Y和R2X的截距)接近0更好,说明模型没有捕捉到随机噪声,而是真实反映了数据间的...
交叉验证:R2是相关性系数,表示这个模型的拟合性好不好,是一个定量的测量(范围0-1),意味着所建立的模型能在多大程度上代表真实的数据,一般当R2在0.7,0.8表示模型解释能力较好。Q2表示PLS-DA模型的预测效果,一般Q2大于0.5表示预测能力较好,并且R2与Q2的值应该比较接近。 模型验证图permutation test的横坐标表示模型的...
PLS-DA(偏最小二乘判别分析)是一种结合降维与分类功能的多变量统计方法,适用于高维度数据的分组差异分析。其通过构建潜在变量最大化组间差
表1 PLS-DA模型的评价参数 注:表中A:表示主成分数;R2X:表示模型对X变量解释率;R2Y:表示模型对Y变量的解释率;Q2:表示模型预测能力。 四、差异代谢物筛选 ORIGINGENE 1) OPLS-DA模型得到的变量权重值(Variable Importance for the Projection, VIP)用于衡量各代谢物的表达模式对样本分类判别的影响强度和解释能力...
为了深入探索桂花细胞液在不同温度和时间条件下的香气成分差异,并验证这些差异的可靠性,研究采用了偏最小二乘判别分析(PLS-DA)模型。该模型通过一系列严格的验证步骤,确保了结果的准确性和可靠性。首先,模型通过排列检验进行了200次的交叉验证,这一过程中,Q2回归线与纵轴的相交点小于零(R2=0.369, Q2=-0.826),这...
1. 所有蓝色的Q2点均低于最右的原始的蓝色的Q2点(图中最右的蓝色Q2点有可能和绿色R2点重合在最右上角);2. 点的回归线与X轴交叉或者与Y轴交点小于0。 图:PLS-DA得分图 图:置换检验图 二、差异代谢物筛选主要是利用PLS-DA中计算的VIP值、单变量统计分析中计算出的P值以及在两组比对时会计算差异倍数值FC...
由上图,PLS-DA模型的R2Y和Q2Y与随机置换数据后获得的相应值进行比较。 左下图,展示了各样本在投影平面内以及正交投影面的距离,具有高值的样本标注出名称,表明它们与其它样本间的差异较大。颜色代表性别分组。 右下图,各样本在PLS-DA轴中的坐标,颜色代表性别分组。我们可以看到,相对于上文的PCA(仅通过方差特征...
OPLS-DA分析中,S-plot图帮助识别与主成分和分类相关性强的代谢物,同时评估模型的R2X、R2Y和Q2值,反映模型对X和Y矩阵的解释率以及预测能力。验证图通过permutation test确定模型的最优性。要进行PCA、PLS-DA、OPLS-DA分析,可以使用如MetaboAnalyst这样的在线平台,它提供从数据预处理到模型构建和图形...
OPLSDA: 定义:进一步整合了PLSDA与正交信号过滤技术,能够最大化与分类无关的信息分离,集中于与分类最相关的因素。 用途:适用于两组样本间的比较,通过寻找与主成分正交的矫正轴方向,强化组间样本的分离,弱化组内差异。 结果解读:Splot图帮助识别与主成分和分类相关性强的代谢物;评估模型的R2X...