我一直在努力探索错误发现率(FDR)应该如何告知个别研究人员的结论。例如,如果您的研究动力不足,即使在结果显着,您是否应该打折呢?注意:我在谈论FDR时是在综合检查多项研究结果的背景下,而不是将其作为多项测试校正的方法。
使(也许大方)假设测试的假设实际上是真,FDR是两种类型的函数I和II型错误率如下:
有理由认为,如果一项研究的能力不足,那么即使结果显着,我们也不应像进行充分研究的结果那样相信结果。因此,正如某些统计学家所说,在某些情况下,“长远来看”,如果遵循传统准则,我们可能会发布许多错误的重要结果。如果一项研究的特点是始终缺乏足够的研究能力(例如,前十年的候选基因环境相互作用文献),那么甚至有重复的重大发现也可能是可疑的。
应用R包extrafont
,ggplot2
和xkcd
,我认为这可能会有用地概念化为一个透视问题:
有了这些信息,研究人员下一步应该做什么?如果我猜测我正在研究的效应的大小(因此,鉴于我的样本量,则估计为),我是否应该调整我的α水平直到FDR = .05?即使我的研究能力不足,我是否应该以α = .05的水平发布结果,并将FDR的考虑留给文献消费者?
我知道这是一个在本网站和统计文献中都经常讨论的话题,但是我似乎无法就此问题达成共识。
编辑:响应@amoeba的评论,FDR可以从标准的I型/ II型错误率偶发表中得出(请避免其丑陋):
| |Finding is significant |Finding is insignificant |
|:---------------------------|:----------------------|:------------------------|
|Finding is false in reality |alpha |1 - alpha |
|Finding is true in reality |1 - beta |beta |
因此,如果为我们提供了一个重要发现(第1列),那么实际上它是错误的机会就是该列总和的alpha。
但是可以,我们可以修改FDR的定义,以反映给定假设为真的(先前)概率,尽管研究能力仍然起作用: