直观来看,FDR是用上面混淆矩阵的第二行算出来的。 那么,如何计算FDR?我们可以用Benjamini-Hochberg (𝐵𝐻) 方法。 对于m个独立的假设检验(比如m个基因),它们的P-value分别为:𝑝𝑖, 𝑖=1,2,…,𝑚 (1)按照升序的方法对这些P-value进行排序,得到: (2)对于给定的统计...
只需输入所有的p值,选择校正算法为BH算法即可,代码如下: pvalue_adjust <- p.adjust(pvalues, method ="BH", n = length(pvalues)) 03 Q值计算 同FDR值计算,需要输入所有的p值,选择校正数据为P-value qvalues <- fdrtool(pvalues, statistic ="pvalue")$qval 综上所述,我们了解了p值、q值和FDR值的...
即False Discovery Rate错误发现率,是通过对差异显著性p值(p-value)进行校正得到的。由于转录组测序的差异表达分析是对大量的基因表达值进行独立的统计假设检验,会存在假阳性问题,因此在进行差异表达分析过程中,采用了公认的Benjamini-Hochberg校正方法对原有假设检验得到的显著性p值(p-value)进行校正,并最终采用FDR作为...
FDR的计算公式为:q-value(i) = p(i) length(p) / rank(p),其中length(p)是p值的数量,rank(p)是当前p值在排序中的位置。
修正的q*值取最小值,即为我们平时工作中用到的修正的FDR值q-valuei。这里的公式即为Bonferroni型多重检验过程中的公式。也是开始FDR的计算公式: 最后是FDR校正后的p值计算的一个小例子。 大家可以移步该网页查看 http://stat.ethz.ch/R-manual/R-devel/library/stats...
在基因表达数据分析中,Log2FC、p值和FDR值是关键指标。Log2FC代表差异倍数,指输入的表达矩阵中实验组的平均表达量与对照组平均表达量之比取对数,正负值指示基因上调或下调。计算方法为log2(B+1) - log2(A+1),可避免取对数时产生NA值。直接计算表达量之差会导致差异表达基因的幅度难以准确反映...
首先从上面的混淆矩阵来展示p值域q值的计算公式,就可以看出它们之间的区别: ((1)p值 p值实际上就是false positive rate(FPR,假正率): p-value=FPR=\frac{FP}{FP+TN} 直观来看,p值是用上面混淆矩阵的第一列算出来的(2)q值 q值实际上就是false discovery rate (FDR): q-value=FDR=\frac{FP}{FP+TP...
FDR实现了通过排序和校正p值来控制假阳性的数量,而避免增加假阴性错误。多次检验会导致假阳性事件累积。当从同一分布中反复抽样并计算10000次统计检验的p值时,我们会发现,尽管大部分p值呈均匀分布,但仍有部分p值小于0.05,这些事件即可视为假阳性。(2)若我们从两个截然不同的分布中反复抽样,并执行10000次...
1.对p值进行从小到大的排序,标记上序号1~n; 2.其中,最大的FDR(不考虑重复则为第n位)等于最大的p值; 3.对于n-1位的FDR,取下面两者的较小值: 上一步(第n位)计算得出的FDR值; p值*n/(n-1) 4.不断迭代第三步(n-2,n-3...),直至计算到最小p值对应的FDR。 例子...