BH法有时也称fdr法,是我们最常用的多重假设检验校正方法,可以很好的控制假阳性率和维持统计检出力。R函数p.adjust可用来计算一组p-value校正后的fdr值。(DESeq2中返回的padj也是用BH方法控制的FDR) q-value是什么? q-value是Storey和Tibshirani提出的基于p-value分布的FDR计量方法,具体见什么,你算出的P-value看...
我们在生物数据统计分析中,经常会听到p-value,adjusted p-value,q-value以及False discovery rate(FDR)。比如最常见实验组和对照组的差异基因表达分析,除了获得一个p值(p-value),通常而言还会得到一个adjusted p-value或者FDR(false discovery rate)。那么他们之间到底有什么关系,为什么已经有了一个p-value来指征显...
BH法有时也称fdr法,是我们最常用的多重假设检验校正方法,可以很好的控制假阳性率和维持统计检出力。R函数p.adjust可用来计算一组p-value校正后的fdr值。(DESeq2中返回的padj也是用BH方法控制的FDR) q-value是什么? q-value是Storey和Tibshirani提出的基于p-value分布的FDR计量方法,具体见什么,你算出的P-value看...
keytype = “ENSEMBL”, ont = “BP”, pAdjustMethod = “BH”, pvalueCutoff = 0.01, qvalueCutoff = 0.05) ##查看富集结果数据 enrich_go <- as.data.frame(ego) ##作图 barplot(ego, showCategory=10) dotplot(ego) enrichMap(ego) plotGOgraph(ego) KEGG富集,首先需要将ENSEMBL ID转化为ENTREZ ...
如果对一组10000个基因进行检测,按照p<0.05筛选的差异基因中有500个可能是差异不显著的。因此,同时进行多次统计检验时,校正每个基因的p值是很重要的。多重检验校正调整每个基因的p值,以使总体错误率小于或等于用户指定的p-cutoff value。 如何进行多重假设检验校正?
总结起来就三句话: (1)当同一个数据集有n次(n>=2)假设检验时,要做多重假设检验校正 (2)对于Bonferroni校正,是将p-value的cutoff除以n做校正,这样差异基因筛选的p-value cutoff就更小了,从而使得结果更加严谨 (3)FDR校正是对每个p-value做校正,转换为q-value。q=p*n/rank,其中rank是指p-value从小到大...
总结起来就三句话: (1)当同一个数据集有n次(n>=2)假设检验时,要做多重假设检验校正 (2)对于Bonferroni校正,是将p-value的cutoff除以n做校正,这样差异基因筛选的p-value cutoff就更小了,从而使得结果更加严谨 (3)FDR校正是对每个p-value做校正,转换为q-value.q=p*n/rank,其中rank是指p-value从小到大排...
(2)对于Bonferroni校正,是将p-value的cutoff除以n做校正,这样差异基因筛选的p-value cutoff就更小了,从而使得结果更加严谨 (3)FDR校正是对每个p-value做校正,转换为q-value。q=p*n/rank,其中rank是指p-value从小到大排序后的次序。 举一个具体的实例: ...
p−value=FPR=FPFP+TN 直观来看,p值是用上面混淆矩阵的第一列算出来的 q值 q值实际上就是false discovery rateFDR: q−value=FDR=FPFP+TP 直观来看,q值是用上面混淆矩阵的第二行算出来的 但是仅仅知道它俩的计算公式的差别还不够,我们还有必要搞清楚一个问题:它俩在统计学意义上有什么不同呢?
可以计算出q-value:[公式]根据q-valuea的计算公式,我们可以很明显地看出:[公式]即,根据该基因p值的排序对它进行放大,越靠前放大的比例越大,越靠后放大的比例越小,排序最靠后的基因的p值不放大,等于它本身 我们也可以从可视化的角度来看待这个问题:对于给定的[公式] ,设函数 [公式] ,画...