GO 富集分析通过分析差异基因在生物学过程,分子功能、细胞组成中的富集定位,从而对基因进行注释和分类,它通过设定 cut-off 值选出差异表达基因,对它们进行 GO terms 富集度统计学分析,计算出差异基因 GO terms 的 p-value 及 p-value 的 FDR 值(q-value),定位差异基因最可能相关的 GO terms,也就找出了该组...
一般认为校正后的富集分数(NES)|NES|>1,p<0.05, qvalue(即FDR)<0.25的结果有意义。 4 GSEA实战 代码语言:txt AI代码解释 #加载数据 数据链接:https://wwu.lanzouf.com/idmJB07bcefa load(file = 'GSEA_test.Rdata') colnames(deg) head(deg) #得到差异基因列表后取出 ,p值和logFC nrDEG=deg[,c(2...
NES:normalized enrichment score,考虑该基因集的大小,将每个基因集的ES值标准化,得到标准化的富集分数。 NOM p-val:nominal P value ,名义p值,富集分析统计学显著水平。 FDR q-val:false discovery rate q-val ,假阳性率P值,多重假设检验后得到的富集分析统计学显著水平。 FWER p-val:familywise-error rate ...
通过基于表型而不改变基因之间关系的排列检验 (permutation test)计算观察到的富集得分(ES)出现的可能性。若样品量少,也可基于基因集做排列检验 (permutation test),计算p-value。 p.adjust: 通过 p 值校正方法得到的校正后的 p 值。 qvalue: 通过 p 值校正方法得到的校正后的 q 值,也称为 FDR。 rank:当 ...
其中:GS为基因集的名字;SIZE代表该基因集下的基因总数;ES代表Enrichmentscore;NES代表归一化后的Enrichmentscore;NOMp-val代表pvalue,表征富集结果的可信度;FDRq-val代表qvalue,是多重假设检验矫正后的p值。(注意GSEA采用pvalue<5%, qvalue < 25%对结果进行过滤。) ...
其中:GS为基因集的名字;SIZE代表该基因集下的基因总数;ES代表Enrichmentscore;NES代表归一化后的Enrichmentscore;NOMp-val代表pvalue,表征富集结果的可信度;FDRq-val代表qvalue,是多重假设检验矫正后的p值。(注意GSEA采用pvalue<5%, qvalue < 25%对结果进行过滤。) ...
通常设置|NES|大于1作为显著富集的阈值。 NOM pvalue:未经过多重检验校正的pvalue。通常设置NOM pvalue小于0.05作为显著富集的阈值。 FDR qvalue:经过多重检验校正后的pvalue,用于控制假发现率。通常设置FDR qvalue小于0.25作为显著富集的阈值。 leading_edge.list:在富集过程中起关键作用的基因...
与GO富集分析的差异在于GSEA分析不需要指定阈值(p值或FDR)来筛选差异基因,我们可以在没有经验存在的情况下分析我们感兴趣的基因集,而这个基因集不一定是显著差异表达的基因。GSEA分析可以将那些GO/KEGG富集分信息中容易遗漏掉的差异表达不显著却有着重要生物学意义的基因包含在内。
1.基因集的富集得分:GSEA采用p-value和q-value对富集结果进行统计学分析。其中,p-value是对富集得分的统计学分析,用来表征富集结果的可信度;q-value则是多重假设检验校正之后的p-value,即对NES可能存在的假阳性结果的概率估计。通常,要求Pvalue<0.05,q值(也就是FDR)<0.25。 2.富集曲线和富集分数:在GSEA中,基因...
一般认为校正后的富集分数(NES)|NES|>1,p<0.05, qvalue(即FDR)<0.25的结果有意义。 四、GSEA实战 安装并导入要用到的R包 BiocManager::install("clusterProfiler") #感谢Y叔的clusterprofiler包 BiocManager::install("enrichplot") #画图需要 BiocManager::install("org.Hs.eg.db") #基因注释需要 ...