基因功能富集分析,是指借助各类数据库和分析工具进行统计分析,挖掘在数据库中与我们要研究的生物学问题具有显著相关性的基因功能类别。它的统计原理是用超几何分布型来检验一组基因(共表达或差异表达)中某个功能类的显著性,通过离散分布的显著性分析、富集度分析和假阳性分析, 得出与实验目的有显著关联的、低假阳性率...
富集分析作为常用工具,其原理是通过统计分析确定一组基因的功能类别与研究问题的关联性,运用超几何分布检验和多重检验校正,确保结果的显著性和低假阳性率。首要任务是将基因分类,通过P值和Q值判断相关性是否显著。前景基因和背景基因是关键概念,前景基因是实验组和对照组中表达变化明显的基因,但也可选...
该包抓取最新的KEGG数据进行计算,保证富集结果的可靠性。另外,该包还可以对富集结果进行比较并可视化(基于ggplot2包:http://ggplot2.org/book/)。具体参数设置为:p-value cutoff=0.01,q-value cutoff=0.05,p值矫正方法为BH(即把每个p-value进行矫正,转换为q-value)。 2 去冗余 因为GO条目的分级特性,其富集结...
该包抓取最新的KEGG数据进行计算,保证富集结果的可靠性。另外,该包还可以对富集结果进行比较并可视化具体参数设置为:p-value cutoff=0.01,q-value cutoff=0.05,p值矫正方法为BH(即把每个p-value进行矫正,转换为q-value)。 2 去冗余 因为GO条目的分级特性,其富集结果会有冗余,对结果的分析造成影响,其中一个策略是...