富集分析的基本原理是利用目标物质与基质之间的相互作用差异,通过改变基质的性质或与之物理/化学作用,使目标物质得以富集。这种富集可以通过吸附、萃取、分配、离子交换、凝胶过滤、电洁析等方式进行。 在实际应用中,常使用适当的吸附剂、溶剂、萃取剂、离子交换剂等来实现对目标物质的选择富集。通过调节温度、pH值、盐...
1. 富集分析原理是什么? 基因功能富集分析,是指借助各类数据库和分析工具进行统计分析,挖掘在数据库中与我们要研究的生物学问题具有显著相关性的基因功能类别。它的统计原理是用超几何分布型来检验一组基因(共表达或差异表达)中某个功能类的显著性,通过离散分布的显著性分析、富集度分析和假阳性分析, 得出与实验目的...
富集分析的核心原理是基于假设,即在给定的基因集中,相关的基因会聚集在特定的生物学过程、通路或分子功能中。通过将基因集与已知的功能注释数据库进行比较,可以鉴定与给定基因集显著富集的功能项。 3. 富集分析通常包含以下步骤: 3.1 首先要准备待分析的基因列表,这些基因通常是通过高通量测序、基因芯片等技术获得的。
将富集分析中的问题抽象出来,其实就是下图的“摸球”问题。 蓝色方框中的球是所有的基因【共N个】,在探究某个特定通路P时,通路里面涉及到的基因用红色表示【共M个】。绿色圆圈是一次摸球事件,用来表示做了一次差异分析得到的基因【共n个】,这些基因中,有属于通路P的(红色球)【共k个】,有不属于的(黑色球)。
富集分析的统计学原理其实本质上就是做一次卡方检验。 卡方检验是将率或构成比的比较演绎为实际频数与理论频数的比较,x^2值反映了实际频数和理论频数吻合的程度。理论频数与实际频数的差异越大时,x^2值越大。如果H0成立,实际频数与理论频数之差一般不会很大,x^2值也会小,当x^2α,则尚无理由拒绝它。相反,若...
富集分析时,很多新接触的,搞错的往往就是没搞清楚原理,背景 和 抽球;基因全集 和 基因选择集合(如差异表达基因集合)。一定要注意,做基因功能富集分析是,背景注释指的是这个物种所有基因的功能注释信息而不是选择集的基因功能注释。比如,做拟南芥的,大概有2w+个基因的功能注释,拿这个做背景;而不是拿差异表达的几...
GSEA富集分析原理 GSEA定义的富集分数计算原理 Gene Set Enrichment Analysis (基因集富集分析) 主要用来评估一个给定基因集内的基因与表型相关性强度,从而判断其对表型的贡献。 根据计算基因与表型的关联度(正相关变化或负相关变化),然后判断基因集内的基因是否富集在表型相关度排序基因表的前部或者后部。从而反映基因...
GSEA分析 一、GSEA介绍 二、GSEA原理 2.1 数据矩阵文件 2.2 GSEA计算中几个关键概念 1. Ranked Gene List L的排序算法 2. 计算富集得分 (ES, enrichment score). 3. 评估富集得分(ES)的显著性。 4. ES标准化 5. 多重假设检验校正(q-value)。
基因富集分析是指对于给定一组基因根据基因组注释信息(GO、KEGG)对基因进行聚类分析,即给定的基因是不是GO中的一个功能(或KEGG中的一个通路)。 基因的功能富集的目的是说明给定的基因集对哪些功能的影响有针对性的,不是随机影响的。 原理: 基因富集分析是通过研究给定的基因集在功能节点上是否过出现得到关注的基因...