p-adjust clusterProfiler包中的enrichKEGG函数和enrichGO函数的默认p值校正方法为BH法 qvalue enrichKEGG函数和enrichGO函数都包含一个用于富集的函数enricher_internal(这个函数属于R包DOSE),而在enricher_internal里,qvalue是用R包qvalue里的qvalue函数算的,用的是bootstrap方法,bootstrap方法是Storey提出的,所以大概...
这是我们最常用的校正P-value控制假阳性率的方式。假设针对10000个基因进行了统计检验,对所有的原始P-value进行由小到大的排序分别为p1, p2, ..., p10000,校正后的FDR为:p1*10000/1, p2*10000/2, ..., p10000*10000/10000。与Bonferroni correction一致的地方是都乘以了检测总数,不一致的地方是BH算法在此...
统计学中有一个指标是q-value(q值),小弟不是很懂, 希望各位详细描述Q-value的意义、计算方法、与p-value的差别. 请不要网上粘贴那些没用的东西,
这是我们最常用的校正P-value控制假阳性率的方式。假设针对10000个基因进行了统计检验,对所有的原始P-value进行由小到大的排序分别为p1, p2, ..., p10000,校正后的FDR为:p1*10000/1, p2*10000/2, ..., p10000*10000/10000。与Bonferroni correction一致的地方是都乘以了检测总数,不一致的地方是BH算法在此...
q-value是Storey和Tibshirani提出的,它基于p-value分布,能提供一个调整后的FDR估计。减少统计检验次数的方法之一是通过筛选或预处理数据,只对可能重要的部分进行深入分析。总的来说,这些校正方法旨在平衡检验的敏感性和可靠性,确保在大量假设检验中得出的结果更为准确。通过理解这些概念,研究人员能够更...
q-value的概念源自优化的FDR方法。它通过利用p值分布的特性生成调整后的p值列表,旨在控制所有显著检验结果中错误发现的数量。与p值相比,q值更倾向于减少假阳性,尤其是在进行大量假设检验时。在代谢组学实验中,假设存在4000个化合物,其中化合物A的p值为0.0101,q值为0.0172。p值表示假阳性的可能性...
P(k)<= α* (k/m) # m为总检验次数 # 1~k均为阳性结果 #该策略假设的是假阳性与真阳性虽然都是阳性,但假阳性与真阳性本质截然不同,故从假阳性到真阳性是斜率陡然上升的。 除了BH外,还可以直接设定FDR。 总结: adj.P其实就是q value;
q-value可以简单理解为表示p-value产生假阳性的概率,当q-value < 0.05时,p-value显著的假阳性小于0.05。 q值(q-value)是p值校正后的结果。 可定义为:多重假设检验过程中,错误拒绝(拒绝真的原假设(零假设))的个数占所有拒绝的原假设个数的比例的期望值(也是代表出错率)。
从P-value列表计算得到Q-value列表的统计模型有很多(参考R语言中p.adjust函数)。 P-value列表计算得到Q-value后,各个元素的大小排序不发生改变(不考虑相等的情况)。 相对于P-value列表中的对应元素的p值,其q值只会变大(或不变),不会变小(但不会超过1)。
调整后的p-value,如q-value,是FDR的计算结果,它考虑了所有显著性检验的全局错误率,而非仅仅基于单一的p-value阈值。例如,在基因表达差异分析中,如果设置p-value为0.05,可能会有大量假阳性。FDR则确保在显著性结果中,真正的差异发现不会被过多的假阳性淹没。q-value是FDR的另一种表达方式,...