基因集富集分析(Gene Set Enrichment Analysis, GSEA)是是一种计算方法,用于确定事先定义的一组基因是否在不同的样品中差异表达。 GSEA首先将基因在样品中的差异倍数值(logFC)由大到小排序,然后判断来自功能注释等预定义的基因集或自定义的基因集中的基因是富集在这个排序列表的顶部还是底部,如果在富集顶部
首先对每个基因子集s计算得到的ES根据基因集的大小进行标准化得到Normalized Enrichment Score (NES)。随后针对NES计算假阳性率。④Leading-edge subset,对富集得分贡献最大的基因成员。四GSEA结果简述GSEA中最常见的就是如下图例:图2.GSEA例图其中可以看做三个部分:第一个部分为Enrichment Score的折线图。纵轴为ES,...
1、图最上面部分展示的是富集分数(ES,enrichment score)值计算过程,从左至右每到一个基因,计算出一个ES值,连成线。在最左侧或最右侧有一个特别明显的峰值就是基因集表型上的ES值。图中间部分每一条线代表基因集中的一个基因,及其在基因列表中的排序位置。 2、最下面部分展示的是基因与表型关联的矩阵,红色为与...
GSEA主要包括四个步骤:1:基因排序2:计算富集得分(Enrichment Score)3:估计富集得分的显著性水平4:多重假设检验。 Step1、基因排序 1)根据所有基因的表达数据,计算每个基因在分组间的差异(signal2 noise),然后按照在两个表型中的差异度从大到小排序,形成一个排好序的基因列表。 2)根据排序好的基因列表,判断基因...
计算富集分数(Enrichment Score, ES) 解读:绝对值越大,代表基因集S在排名列表L的顶部(正值)或底部(负值)被过度代表(overrepresented); 计算过程:给定初始统计量x, 沿着排序列表从top→bottom遍历每个基因,遇到属于基因集S的基因,则x = x+ai;若遇到不属于基因S的基因j,则x = x - aj…… 直到遍历所有基因。
GS为基因集的名字,SIZE代表该基因集下的基因数, NES代表归一化后的Enrichment score(ES), 注意GSEA采用p value < 5%, q value < 25% 对结果进行过滤。点击GS DESC可以跳转到每个基因集详细结果页面,示例如下 首先是一个汇总的结果,Upregulated in class说明该基因集在MUT这组中高表达,其他信息和之前介绍...
GSEA主要包括三个步骤:计算富集得分(EnrichmentScore);估计富集得分的显著性水平;多重假设检验。 GSEA输入的是两组样本的基因的表达量数据,找到两组样本的差异表达基因,根据Foldchange进行排序,来直观展示不同基因在两组样本的变化趋势。排序之后,顶部的基因认为是A组上调的差异基因,底部基因认为是A组下调的差异基因。
1. GSEA的核心概念 定义:GSEA旨在识别特定基因集合在不同样品中是否表现出显著差异表达,从而揭示其潜在的生物学意义。 目的:通过计算Enrichment Score,量化特定基因集合在数据集中富集的程度。2. 数据准备 收集基因表达数据:确保数据的质量和完整性,为后续分析奠定坚实基础。 定义研究的基因集合:根据...
这样的话我们就先来看第一部分的Enrichment score折线图:它展示的就是基因集中基因按排序计算时,富集分数在计算到每个位置时的展示。可以在图中看到曲线有个最高峰,该处的得分就是是基因集的富集评分,位于最高峰前的的基因就是核心基因。 第二部分:基因集中基因排列的情况图,即图中红色的的竖线排列情况情况,还可...