以下是PLS-DA的一些关键公式和概念: 首先,PLS-DA基于偏最小二乘法(PLS),它是一种同时考虑自变量矩阵X和因变量矩阵Y的回归方法。在PLS中,X和Y被分解为得分矩阵(T和U)和载荷矩阵(P和Q)的乘积,并加上残差矩阵(E和F): X = TP' + E Y = UQ' + F 其中,T和U分别为X和Y的得分矩阵,P和Q分别为X和...
这是核心公式 fit <- vglm(Species~., family=multinomial, data=iris) 分类结果如下 我们再用LDA来做,核心公式如下 fit <- lda(Species~., data=iris) 分类结果如下 我们再用PLSDA来做 核心公式如下 fit <- plsda(x, y, probMethod="Bayes") 很清晰的小算法,但很实用,尤其是PLSDA,在生信领域组学...
今天,我们将 在Arcene数据集上执行PLS-DA, 其中包含100个观察值和10,000个解释变量。 让我们开始使用R 癌症/无癌标签(编码为-1 / 1)存储在不同的文件中,因此我们可以将其直接附加到完整的数据集,然后使用公式语法来训练模型。 # 安装加载 library(caret) arcene <- read.table("train.data", sep = " "...
就是5,反之就是0.2。用这种方法分析微阵列的数据可以 说明:1)从基因表达的绝对值而来的表达变化是有意义的;2)这种方法可以说明基因表达变化是否显著;3)可以利用这种模型用于有效数据的筛选。数据有value1 和value2 foldchange=log2(value2/value1),计算差异是否显著p<0,01)文献上关于p计算的公式 ...
4 VIP images of Xanthii Fructus min(xj)]对原始数据矩阵进行归一化处理(表 4),建 立规范化矩阵.以 PLS-DA 所得 10 种化学成分变 量重要性投影值为各指标权重,根据公式 Z= (x*ij×Wj)mn 得加权决策矩阵表(表 5).根据加权 决策矩阵得最优方案 Z+分别为 1.202 0,0.415 0, 1.148 0,1.392 0,0.332...
同时,结合偏最小二乘判别分析建模,plsda是一种用于判别分析的多变量统计分析方法。判别分析是一种根据观察或测量到的若干变量值,来判断研究对象如何分类的常用统计分析方法。偏最小二乘法判别分析可以减少变量间多重共线性产生的影响。 本发明采用了快速衰减式淘汰算法和偏最小二乘判别结合的方法,使近红外光谱分析法...
半定量计算其余组分含量,计算公式如下: 各组分含量(μg/g) = 各组分的峰面积(A) × 内标物含量(μg) 内标峰面积(A) × 样品量(g) 1.3 数据处理 原始数据用 Microsoft Excel 2019 进行预处理; 采用 SPSS 22.0 进行单因素方差分析;采用 SIMCA- P14.1 进行偏最小二乘(PLS-DA)分析;采用 Origin 2019 ...
二、 PLS-DA (partial least squares discriminant analysis) plsFit <- train( Class ~ ., data = training, method = "pls", preProc = c("center", "scale"), ##added: tuneLength = 15 ) 添加的参数tuneLength意思为前15个主成分都要做一遍, tuneGrid是会为模型赋予特殊值 ...
二、SEP 计算公式 SEP(Standardized Estimated Predictive,标准化预测误差)计算公式是评估 PLS 模型预测性能的一个重要指标。SEP 值表示模型预测值与实际值之间的误差,其计算公式如下: SEP = (1/n) * ∑(y_i - _i)^2 / σ_i^2 其中,n 表示样本数量,y_i 表示实际值,_i 表示预测值,σ_i 表示第 i ...