直观来看,FDR是用上面混淆矩阵的第二行算出来的。 那么,如何计算FDR?我们可以用Benjamini-Hochberg (𝐵𝐻) 方法。 对于m个独立的假设检验(比如m个基因),它们的P-value分别为:𝑝𝑖, 𝑖=1,2,…,𝑚 (1)按照升序的方法对这些P-value进行排序,得到: (2)对于给定的统计...
02 FDR值计算由于FDR值是对多重假设检验的校正,我们必须要有足够多的P-value,才能支撑起我们的FDR校正算法,这里不展示数据,只展示一下过程。只需输入所有的p值,选择校正算法为BH算法即可,代码如下:pvalue_adjust <- p.adjust(pvalues, method = "BH", n = length(pvalues)) 03 Q值计算同FDR值计算...
修正的q*值取最小值,即为我们平时工作中用到的修正的FDR值q-valuei。这里的公式即为Bonferroni型多重检验过程中的公式。也是开始FDR的计算公式: 最后是FDR校正后的p值计算的一个小例子。 大家可以移步该网页查看 http://stat.ethz.ch/R-manual/R-devel/library/stats...
即False Discovery Rate错误发现率,是通过对差异显著性p值(p-value)进行校正得到的。由于转录组测序的差异表达分析是对大量的基因表达值进行独立的统计假设检验,会存在假阳性问题,因此在进行差异表达分析过程中,采用了公认的Benjamini-Hochberg校正方法对原有假设检验得到的显著性p值(p-value)进行校正,并最终采用FDR作为...
p值实际上就是false positive rate(FPR,假正率): p-value=FPR=\frac{FP}{FP+TN} 直观来看,p值是用上面混淆矩阵的第一列算出来的(2)q值 q值实际上就是false discovery rate (FDR): q-value=FDR=\frac{FP}{FP+TP} 直观来看,q值是用上面混淆矩阵的第二行算出来的 但是仅仅知道它俩的计算公式的差别还...
和BH控制不同,q值和pFDR正好相反,即通过选定的拒绝域Talpha去估计对应的q值,当q小于等于alpha时,可保证FDR小于等于alpha。Storey给出了关于q值和pFDR的估计算法。 根据p值或q值可以计算对应的FDR,多重假设检验中拒绝H0的次数。 BH计算错误发现率时具有保守性,即在降低假阳性的同时,也减少了正确的假设。为此可采用...
i)小于等于(iq)/m,其中q为预设的错误比例阈值,m为候选基因总数。这种方法确保FDR不超过设定的阈值,最终挑选对应于p(1), p(2), ..., p(i)的基因作为差异表达基因。FDR的计算公式为:q-value(i) = p(i) length(p) / rank(p),其中length(p)是p值的数量,rank(p)是当前p值在排序中的位置。
在基因表达数据分析中,Log2FC、p值和FDR值是关键指标。Log2FC代表差异倍数,指输入的表达矩阵中实验组的平均表达量与对照组平均表达量之比取对数,正负值指示基因上调或下调。计算方法为log2(B+1) - log2(A+1),可避免取对数时产生NA值。直接计算表达量之差会导致差异表达基因的幅度难以准确反映...
1.对p值进行从小到大的排序,标记上序号1~n; 2.其中,最大的FDR(不考虑重复则为第n位)等于最大的p值; 3.对于n-1位的FDR,取下面两者的较小值: 上一步(第n位)计算得出的FDR值; p值*n/(n-1) 4.不断迭代第三步(n-2,n-3...),直至计算到最小p值对应的FDR。 例子...