FDR是指在所有声称显著的检验中,实际上不显著的检验的比例的期望值。 在实际应用中,通常推荐使用FDR阈值(如0.05)来确定哪些基因是差异表达的。如果只使用Pvalue,并将阈值设定为0.05,即便所有的实验结果实际上都是非显著的,但你依然有64.15%的可能性“观测”到至少一个“显著差异”的结果。 Fig3 总有一次“显著”...
这是我们最常用的校正P-value控制假阳性率的方式。假设针对10000个基因进行了统计检验,对所有的原始P-value进行由小到大的排序分别为p1, p2, ..., p10000,校正后的FDR为:p1*10000/1, p2*10000/2, ..., p10000*10000/10000。与Bonferroni correction一致的地方是都乘以了检测总数,不一致的地方是BH算法在此...
这是我们最常用的校正P-value控制假阳性率的方式。假设针对10000个基因进行了统计检验,对所有的原始P-value进行由小到大的排序分别为p1, p2, ..., p10000,校正后的FDR为:p1*10000/1, p2*10000/2, ..., p10000*10000/10000。与Bonferroni correction一致的地方是都乘以了检测总数,不一致的地方是BH算法在此...
这里可以看出P-value>0.05,所以得出结论,认为原假设成立,两组数据相等。02 FDR值计算由于FDR值是对多重假设检验的校正,我们必须要有足够多的P-value,才能支撑起我们的FDR校正算法,这里不展示数据,只展示一下过程。只需输入所有的p值,选择校正算法为BH算法即可,代码如下:pvalue_adjust <- p.adjust(pva...
那么,如何计算FDR?我们可以用Benjamini-Hochberg (𝐵𝐻) 方法。 对于m个独立的假设检验(比如m个基因),它们的P-value分别为:𝑝𝑖, 𝑖=1,2,…,𝑚 (1)按照升序的方法对这些P-value进行排序,得到: (2)对于给定的统计显著性值𝛼∈(0,1)(通常是0.05,在某些情况下,...
我们在生物数据统计分析中,经常会听到p-value,adjusted p-value,q-value以及False discovery rate(FDR)。比如最常见实验组和对照组的差异基因表达分析,除了获得一个p值(p-value),通常而言还会得到一个adjusted p-value或者FDR(false discovery rate)。那么他们之间到底有什么关系,为什么已经有了一个p-value来指征显...
这里可以看出P-value>0.05,所以得出结论,认为原假设成立,两组数据相等。 02 FDR值计算 由于FDR值是对多重假设检验的校正,我们必须要有足够多的P-value,才能支撑起我们的FDR校正算法,这里不展示数据,只展示一下过程。 只需输入所有的p值,选择校正算法为BH算法即可,代码如下: ...
q-value是Storey和Tibshirani提出的,它基于p-value分布,能提供一个调整后的FDR估计。减少统计检验次数的方法之一是通过筛选或预处理数据,只对可能重要的部分进行深入分析。总的来说,这些校正方法旨在平衡检验的敏感性和可靠性,确保在大量假设检验中得出的结果更为准确。通过理解这些概念,研究人员能够更...
将所有p.value直接用p.adjust中的'BH’方法进行校正,head展示前六个结果,可以看出得到的结果与topTable一致; 仅将第一个p.value用p.adjust中的'BH’方法进行校正,得到的结果其实与p.value一致; 综上: 在多重检验的时候,需要对p值进行校正; FDR(Benjamini and Hochberg(BH))是p值的校正方法之一;(所以,统计学...
p-value是指你观察到m个基因落在通路里,比这还要更极端的概率之和,所以i是从m到M。就是说看到更多的基因落在这个通路里的所有可能。所以超几何检验很方便地 可以给你算一个p-value,最后得到p-value<0.01或者0.05,你的结果如果定义p-value<0.05 那就有5%的概率看到是一个假阳性,这里我们只是在谈拿...