因此,为了计算q-value,会在一个新的统计量NES(normalized enrichment score)上来做。 NES的计算公式如下: \zeta_k^{GSEA} = \frac{S_k^{GSEA}}{E[S_{k,\boldsymbol{\pi(k)}}^{GSEA}]} 在实际计算中,由于ES分正负。因此会区别对待。 \begin{equation*} \zeta_k^{GSEA} = \begin{cases} \...
1.基因集的富集得分:GSEA采用p-value和q-value对富集结果进行统计学分析。其中,p-value是对富集得分的统计学分析,用来表征富集结果的可信度;q-value则是多重假设检验校正之后的p-value,即对NES可能存在的假阳性结果的概率估计。通常,要求Pvalue<0.05,q值(也就是FDR)<0.25。 2.富集曲线和富集分数:在GSEA中,基因...
NOM p-value,即Nominal p value,是对富集得分(ES)的统计学分析,但未根据基因集的大小或多重假设检验来校正,因此在比较不同基因集的作用上有限。 FDR q-value,即假阳性率(False discovery rate)。是对标准化富集得分(NES)可能存在的假阳性结果的概率估计。因此FDR越小说明富集越可靠。FDR比NOM p-value更有参考...
NOM p-val:即p-value,是对富集得分ES的统计学分析,用来表征富集结果的可信度; FDR q-val:即q-value,是多重假设检验校正之后的p-value,即对NES可能存在的假阳性结果的概率估计,因此FDR越小说明富集越显著; RANK AT MAX:当ES值**时,对应基因所在排序好的基因列表中所处的位置; (注:GSEA采用p-value<5%,q...
5. 多重假设检验校正(q-value)。 6. RANK 7. Leading-edge subset 8. LEADING EDGE 三、典型富集结果解读 四、GSEA与传统的比较 参考 一、GSEA介绍 我们先提出问题:在解读传统的富集分析(基于超几何分布或Fisher检验)结果时,经富集分析筛选的功能通路中,既有上调差异基因,也有下调差异基因,那么这条通路总体的...
qvalue用于控制假发现率,以进一步筛选显著富集的基因集。3. 分析结果解读 Enrichment Score:正值表示基因集在表型相关度高的区域富集,负值表示在表型相关度低的区域富集。其绝对值大小反映了富集程度。 NES:归一化后的富集分数,用于比较不同基因集之间的富集程度。通常设置|NES|大于1作为显著富集的阈值...
NOM p-value,即Nominal p value,是对富集得分(ES)的统计学分析,但未根据基因集的大小或多重假设检验来校正,因此在比较不同基因集的作用上有限。 FDR q-value,即假阳性率(False discovery rate)。是对标准化富集得分(NES)可能存在的假阳性结果的概率估计。因此FDR越小说明富集越可靠。FDR比NOM p-value更有参考...
如使用q-value综合考虑多个基因集的富集情况,常用BH算法对NES(Normalized Enrichment Score)进行调整。在R分析中,通常设置|NES|大于1,NOM p-value小于0.05,FDR q-value小于0.25作为显著富集的阈值。例如,一个分析结果可能显示一条通路的Enrichment Score约为-0.7,leading_edge.list占比为12%,...
3)优先选择具有统计学差异的基因,比如qvalue < 0.05;如果满足此q值条件的基因较少,可以使用pvalue < 0.05进行筛选,对于基因群体而言,使用q值可以降低假阳性;对于某基因个体而言,如果p值小于0.05,也可以考虑进行后续验证与功能机制探索。如果自己的样本类型异质性较高且在进行测序时生物学重复数偏低,即使p值大于0.05,...
(注:GSEA采用p-value<5%,q-value<25%进行数据过滤) LEADING EDGE:该处有3个统计值,tags=59%表示核心基因占该基因集中基因总数的百分比;list=21%表示核心基因占所有基因的百分比; 对于分析结果中,我们一般认为|NES|>1,NOM p-val<0.05,FDR q-val<0.25的通路是显著富集的。