GO 富集分析通过分析差异基因在生物学过程,分子功能、细胞组成中的富集定位,从而对基因进行注释和分类,它通过设定 cut-off 值选出差异表达基因,对它们进行 GO terms 富集度统计学分析,计算出差异基因 GO terms 的 p-value 及 p-value 的 FDR 值(q-value),定位差异基因最可能相关的 GO te
基因集富集分析(Gene Set Enrichment Analysis, GSEA)是是一种计算方法,用于确定事先定义的一组基因是否在不同的样品中差异表达。 GSEA首先将基因在样品中的差异倍数值(logFC)由大到小排序,然后判断来自功能注释等预定义的基因集或自定义的基因集中的基因是富集在这个排序列表的顶部还是底部,如果在富集顶部,则该基因...
在预先构建好基因注释数据库(例如GO,KEGG等)已对背景基因集(N)根据生物功能或过程进行分类的前提下,通过统计学算法找出有那些显著区别于背景基因集(N)的类别(生物组成/功能/过程),或者找出这组特定基因集间在生物组成/功能/过程的共性,经过聚类后去除冗余得到基因富集结果的过程,即为富集分析。 常用数据 其中,背景...
一般GO富集分析后会看到这样的表格,第一列表示GO的三个levels,ID表示 GO数据库ID,Decription:表示该GO term的功能描述,GeneRAatio:富集到该term里的差异基因数/全部差异基因数,BgRatio:该term的全部基因数/该物种全部有GO注释信息的基因数,pvalue是p值,p.adjust表示矫校正过的p值,qvalue是q值,geneID表...
富集分析方法 富集分析方法主要可以分为四类: 过表达分析:通常是检验差异基因是否显著集中在预先定义的基因集 累积超几何或 Fisher 精确检验 p=1−∑i=0k−1(Mi)(N−Mn−i)(Nn) 式中,N 为背景基因的数量,M 为通路中的基因数,n 为兴趣基因的数量,k 为通路中兴趣基因的数量 显著性打分:对所有差...
特定基因集(S)①转录组分析得到的差异表达基因集②基因组分析中得到的某物种特有的基因集③基因家族收缩扩张分析得到的基因组中显著扩张/收缩的基因集常用的富集分析1.GO富集分析Gene Ontology(简称GO)是基因功能国际标准分类体系;研究差异基因在Gene Ontology中的分布状况并阐明实验中样本差异在基因功能上的体现。GO...
1. 富集分析 1.1. 富集分析概念 富集分析 富集分析,本质上是对数据的分布检验,如果分布集中在某个区域,则认为富集。 常用的分布检验方法有卡方检验、Fisher精确检验以及KS检验等方法。 生物信息学领域的富集分析 在背景基因集(N)下获得一组特定基因集(S),S可能是基因列表,表达图谱,基因芯片等形式。在预先构建好...
富集分析是组学研究中必不可少的一个分析点,一方面它可以宏观预测在处理条件下的有变化的基因具有哪些功能或在哪些通路中起作用,辅助验证自己的实验猜想;另一方面,它可以帮助缩小目标基因的寻找范围,比如对某性状强相关的基因集进行富集分析后,将范围再缩小到目标通路的基因集中。
GSEA,全称是Gene Set Enrichment Analysis,该方法发表于2005年的Gene set enrichment analysis: a knowledge-based approach forinterpreting genome-wide expression profiles,是一种基于基因集的富集分析方法。 2 为什么要做GESEA富集分析 提到基因的富集分析,...