让每个基因根据p值大小从小到大排个队,拿个号牌,然后把自己的p值乘上总基因数,再除以自己号牌上的数就是FDR校正后的p值啦。这个过程用数学语言表示为: 其中,q-valuei是校正后的p值,length(p)是总基因数,rank(p)是每个基因排队的号牌。 那么,为什么要用这个公式完成...
1.按照和p-value类似的定义,Storey给出了q-value的定义。 2.q-value量化了在观察统计量T = t时,拒绝H0所犯的最小pFDR。p-value的定义基于H0=0的条件而量化T属于Talpha的概率,显然q值是p值定义的一个逆过程,q值是基于T属于Talpha的条件而量化H0=0的概率。 3. 和BH控制不同,q值和pFDR正好相反,即通过...
BH法有时也称fdr法,是我们最常用的多重假设检验校正方法,可以很好的控制假阳性率和维持统计检出力。R函数p.adjust可用来计算一组p-value校正后的fdr值。(DESeq2中返回的padj也是用BH方法控制的FDR) q-value是什么? q-value是Storey和Tibshirani提出的基于p-value分布的FDR计量方法,具体见什么,你算出的P-value看...
(4)加权网络:每个脑网络都可以表示为邻接矩阵的形式,横轴和纵轴都是脑区编号,横纵交叉的地方就是相应脑区间的连接值,这种网络就是加权网络。” 二值网络 (5)二值网络:设定一个阈值,当连接值大于这个阈值时,就视为1(有连接);小于这个阈值时,就视为0(无连接),这样就得到一个只区分有连接或者无连接的二值网...
多重检验都得算q-value,即FDR值。原因如下: 参考我的博文:https://www.cnblogs.com/zypiner/p/11777829.html P-value: 由以上可得知P-value的含义。拒绝零假设的概率、上图的末梢的面积、”GO过程在排序基因集L中富集“这一结论错误的概率。 通常,我们取P值的阀值为0.05。即:P值小于0.05的GO过程都认为在...
⼀⽂了解P-value,多重⽐较,FDR和Qvalue的差别 ⾸先交代⼀下⽤来说明这⼏个统计量的例⼦。这⾥会使⽤基因表达作为⼀个例⼦。假设我们有两组细胞:对照组和处理组。我们正在研究基因 A 在处理的条件下是否受到表达或没有表达。每组我们有 12 个重复。我们通常做的是取每组 12 个重复的平均...
经过一系列的推导,pFDR的实际意义是,在pFDR错误率控制下,当拒绝一个H0时,该假设为真实的概率;pFDR反应了已经在拒绝H0的情况下H0 = 0的概率。可以认为pFDR是贝叶斯后验p值。 1. 按照和p-value类似的定义,Storey给出了q-value的定义。 2. q-value量化了在观察统计量T = t时,拒绝H0所犯的最小pFDR。p...
这是我们最常用的校正P-value控制假阳性率的方式。假设针对10000个基因进行了统计检验,对所有的原始P-value进行由小到大的排序分别为p1, p2, ..., p10000,校正后的FDR为:p1*10000/1, p2*10000/2, ..., p10000*10000/10000。与Bonferroni correction一致的地方是都乘以了检测总数,不一致的地方是BH算法在此...
我们在生物数据统计分析中,经常会听到p-value,adjusted p-value,q-value以及False discovery rate(FDR)。比如最常见实验组和对照组的差异基因表达分析,除了获得一个p值(p-value),通常而言还会得到一个adjusted p-value或者FDR(false discovery rate)。那么他们之间到底有什么关系,为什么已经有了一个p-value来指征显...
[公式] [公式] 因此最大的k为4,此时可以得出:在FDR<0.05的情况下,G2,G6,G5 和 G4 存在差异表达 可以计算出q-value:[公式]根据q-valuea的计算公式,我们可以很明显地看出:[公式]即,根据该基因p值的排序对它进行放大,越靠前放大的比例越大,越靠后放大的比例越小,排序最靠后的...