Benjamini&Hochberg以与我相同的方式将误发现率定义为阳性测试中属于假阳性的部分。因此,如果将其过程用于多个比较,则可以正确控制FDR。但是,值得注意的是,BH方法有很多变体。本杰米尼(Benjamini)在伯克利(Berkeley)举办的研讨会在YouTube上进行,非常值得一看:
我不确定@amoeba为什么说“这个措词太过强烈,实际上可能会引起误解”。我想知道他/她为什么这么认为。最有说服力的论据来自模拟的t检验(第6节)。这模仿了几乎每个人在实践中所做的事情,它表明,如果您观察到P接近0.047,并声称已经发现,那么至少有26%的时间您会错。有什么问题吗?
当然,我不应该将此描述为最低要求。如果您假设有50%的机会产生真正的效果,这就是您得到的。当然,如果您假设大多数假设事先都是正确的,那么FDR可能会低于26%,但是您能否想象这种欢笑会迎接您根据假设进行发现的说法您已经90%事先确定您的结论是正确的。假定不是任何合理的先验概率大于0.5的合理依据,则最低FDR为26%。
鉴于直觉通常不会在测试时站起来,因此很可能只有10%的机会可以接受任何特定的假设,而在那种情况下,FDR将会是灾难性的76%。
的确,所有这一切都取决于零假设(即所谓的零点)的零假设。其他选择可以得出不同的结果。但是零点是几乎每个人在现实生活中使用的东西(尽管人们可能并不知道这一点)。此外,在我看来,零点似乎是完全合适的东西。有时有人反对,真正的差异永远不会完全为零。我不同意。我们想告诉我们的结果是否不同于两组都接受相同治疗的情况,因此真正的差异恰好是零。如果我们确定输出数据与该视图不兼容,则我们继续估计效果大小。在那一点上,我们将单独评估一下效果是否真实,但是否足够大到在实践中很重要。Deborah Mayo的博客。
@amoeba感谢您的回复。
Mayo博客上的讨论所显示的大部分内容是Mayo与我不同意,尽管至少在我看来她并没有阐明原因。斯蒂芬·森(Stephen Senn)正确指出,如果您假设其他先验分布可以得到不同的答案。在我看来,这仅对主观贝叶斯主义者有意义。
这与每天的练习总是无关紧要的一点毫无关系。正如我所解释的,在我看来,这是一件非常明智的事情。
许多专业统计学家得出的结论与我的结论大致相同。尝试Sellke&Berger和Valen Johnson(本文引用)。关于我的主张,没有什么有争议的(或非常新颖的)。
关于另一点,关于0.5的事前假设,在我看来根本不是一个假设。正如我在上面解释的那样,任何大于0.5的毛在实践中都是不可接受的。低于0.5的任何值都会使错误发现率更高(例如,如果先前为0.1,则为76%)。因此,如果在单个实验中观察到P = 0.047,则可以预期的最小错误发现率是26%,这是完全合理的。
我一直在考虑这个问题。我对FDR的定义与本杰米尼(Benjamini)的定义相同-积极测试中有误的部分。但这适用于一个完全不同的问题,即单个测试的解释。事后看来,如果我选择一个不同的术语可能会更好。
在单个测试的情况下,B&H保持P值不变,因此就我使用该术语而言,它不会说出任何关于错误发现率的信息。
es当然是正确的。Benjamini&Hochberg和其他从事多个比较工作的人员仅旨在纠正1型错误率。因此,它们最终得到一个“正确的” P值。与其他任何P值一样,它也会遇到相同的问题。在我的最新论文中,为了避免这种误解,我将名称从FDR更改为误报风险(FPR)。
我们还编写了一个Web应用程序来执行一些计算(在注意到很少有人下载我们提供的R脚本之后)。它位于https://davidcolquhoun.shinyapps.io/3-calcs-final/,欢迎对此提出所有意见(请先阅读“注释”选项卡)。
PS Web计算器现在在http://fpr-calc.ucl.ac.uk/上具有一个新的(永久的,希望如此)/
Shiny.io易于使用,但如果有人实际使用该应用程序,则非常昂贵:-(
现在,我的第二篇论文将发表在皇家学会开放科学杂志上,现在我回到了讨论。它在https://www.biorxiv.org/content/early/2017/08/07/144337
我意识到我在第一篇论文中犯的最大错误是使用了术语“错误发现率(FDR)”。在新论文中,我更明确地指出,我没有对多重比较问题说什么。我只处理如何解释在单个无偏测试中观察到的P值的问题。
在最新版本中,我将结果表示为误报风险(FPR)而不是FDR的可能性,以期减少混乱。我还主张采用反向贝叶斯方法-指定确保FPR为5%所需的先验概率。如果观察到P = 0.05,则为0.87。换句话说,您必须几乎(87%)确信在进行实验前FRP达到5%(这是大多数人仍然误认为p = 0.05的意思)才有真实效果。