Benjamini-Hochberg调整后的p值的公式是什么?


14

我了解该程序及其控制的内容。那么在BH程序中用于多次比较的调整后的p值的公式是什么?


刚才我意识到原始的BH不会产生调整后的p值,只是调整了(非)拒绝条件:https : //www.jstor.org/stable/2346101。无论如何,戈登·史密斯(Gordon Smyth)还是在2002年引入了调整后的BH p值,因此该问题仍然适用。p.adjust与method 一样在R中实现BH

Answers:


6

著名的开创性的Benjamini&Hochberg(1995)论文描述了基于调整α水平来接受/拒绝假设的程序。此过程在调整后的方面具有直接等效的重新表示形式,但原始论文中未对此进行讨论。根据Gordon Smyth的介绍,他在2002年在R中实现时引入了调整后的。不幸的是,没有相应的引文,因此我一直不清楚如果使用BH调整后的应该引用什么。pp ppp.adjustp

事实证明,该程序在Benjamini,Heller,Yekutieli(2009)中进行了描述

表示此过程结果的另一种方法是显示调整后的。经过BH调整的定义为pp

p(i)BH=min{minji{mp(j)j},1}.

这个公式看起来比实际要复杂。它说:

  1. 首先,将所有从小到大排序。然后将每个值乘以测试总数,再除以其排名顺序。ppm
  2. 其次,确保结果序列是不递减的:如果它开始减少,则使前一个值等于后继的值(重复,直到整个序列不递减)。p
  3. 如果任何值最终大于1,则使其等于1。p

这是对1995年以来原始BH程序的直接重新表述。可能存在较早的论文,其中明确介绍了BH调整后的的概念,但我不知道。p


更新。@Zenit发现Yekutieli&Benjamini(1999)描述了早在1999年的同一件事:

在此处输入图片说明


这就是我期望的答案,+ 1。我记得还读过有关Gordon Smyth调整后的p值的实现,并且不知道该引用谁,很高兴看到对此有一个“经典”的引用。
Firebug

1
我相信甚至存在更早的参考文献:Yekutieli和Benjamini(1999)(可在此处找到pdf版本)。定义2.4描述了如何根据调整后的p值改写原始的1995 FDR程序。归功于我在此找到的这篇博客文章
泽尼特

@Zenit哦,哇!很棒的发现!我应该更新我的答案。
变形虫说恢复莫妮卡

感谢来源@Zenit!这种无处不在的统计方法没有众所周知的参考文献,这有点奇怪。
Firebug

8

首先一个要点答案。考虑到是与测试统计量的值关联的(单个测试)值。Benjamini-Hochberg FDR分两步计算( =#pvalues, =#pvalues):p0pz0N0 p0N

  • FDR (p0)=p0N0N

  • FDR (pi)=min(FDR(pi),FDR(pi+1))


现在让我们了解一下。贝叶斯的基本思想是观察来自两种分布的混合:

  • π0N来自零密度观测值f0(z)
  • (1π0)N来自替代密度观测。f1(z)

观察到的是这两者的混合:

  • f(z)=π0f0(z)+(1π0)f1(z)

在此处输入图片说明

(贝叶斯)定义是:

  • Fdr=π0(1F0(z0))(1F(z)) (部分尾部区域)
  • fdr=π0f0(z0)f(z) (尾部密度的一部分)

如下所示,当时,Fdr相当于Benjamini hocherg FDR (大多数生物信息学研究就是这种情况)π01

在此处输入图片说明

(基于Efron和Tibshirani的计算机时代统计推断

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.