通过控制FDR(False Discovery Rate)来决定P值的域值. 假设你挑选了R个差异表达的基因,其中有S个是真正有差异表达的,另外有V个其实是没有差异表达的,是假阳性的.实践中希望错误比例Q=V/R平均而言不 能超过某个预先设定的值(比如0.05),在统计学上,这也就等价于控制FDR不能超过5%. 根据Benjamini在他的文章中所...
最近数据分析,涉及到了fdr的筛选,参考文章时,文章中选择了fdr 0.1作为cutoff,但是数据离谱,0.1 作为阈值对于我的数据毫无意义,一个significant 的基因都没有。这时候我们就开始讨论是否可以提高cutoff,这样做是否正确,多大时能够使用,最后我们开始想是否可以用p-value 进行筛选,于是我们开始对这些概念进行讨论,到底什么是...
数据分析中常碰见多重检验问题(multiple testing).Benjamini于1995年提出一种方法,通过控制FDR(False Discovery Rate)来决定P值的域值. 假设你挑选了R个差异表达的基因,其中有S个是真正有差异表达的,另外有V个其实是没有差异表达的,是假阳性的.实践中希望错误比例Q=V/R平均而言不能超过某个预先设定的值(比如0.05...
Benjamini的方法是将FDR控制在一个level以下,而之后 所有的方法都在试图精确地估计FDR。所以后来的这些方法都要powerful一些。不过他们所付出的代价就是robustness。 现有FDR控制方法最大的弊端在于,他们假设p-value's under the null hypothesis是(1)independent(2)following uniform (0,1) distribution. 这两点假设从...
根据Benjamini在他的文章中所证明的定理,控制fdr的步骤实际上非常简单。 设总共有m个候选基因,每个基因对应的p值从小到大排列分别是p(1),p(2),...,p(m),则若想控制fdr不能超过q,则只需找到最大的正整数i,使得 p(i)<= (i*q)/m.然后,挑选对应p(1),p(2),...,p(i)的基因做为差异表达基因,这样...
多重检验中的FDR错误控制⽅法与p-value的校正及 多重检验中的FDR错误控制⽅法与p-value的校正及 原⽂地址:作者:数据分析中常碰见多重检验问题(multiple testing).Benjamini于1995年提出⼀种⽅法,通过控制FDR(False Discovery Rate)来决定P值的域值.假设你挑选了R个差异表达的基因,其中有S个是真正有...
.我刚才强调的是single test,在multiple test中,通常不用p-value,而采用更加严格的q-value.与p-value不同, q-value控制的是FDR (false discovery rate). 3)举个例子.假如有一种诊断艾滋病的试剂,试验验证其准确性为99%(每100次诊断就有一次false positive).对于一个被检测的人(single test)来说,这种准确...
.我刚才强调的是single test,在multiple test中,通常不用p-value,而采用更加严格的q-value.与p-value不同, q-value控制的是FDR (false discovery rate). 3)举个例子.假如有一种诊断艾滋病的试剂,试验验证其准确性为99%(每100次诊断就有一次false positive).对于一个被检测的人(single test)来说,这种准确...
多重检验中的FDR错误控制方法与p-value的校正及Bonferroni校正 数据分析中常碰见多重检验问题 (multiple testing).Benjamini于1995年提出一种方法,通过控制FDR(False Discovery Rate)来决定P值的域值. 假设你挑选了R个差异表达的基因,其中有S个是真正有差异表达的,另外有V个其实是没有差异表达的,是假阳性的....