多重比较文献中“依赖”和“独立”测试的普通语言含义?


18

家庭错误率(FWER)和错误发现率(FDR)文献中,控制FWER或FDR的特定方法都被认为适用于相关或独立测试。例如,在1979年的论文“一个简单的顺序拒绝多重测试程序”中,霍尔姆写道,将他的递增Šidák方法与他的递增Bonferroni控制方法进行了对比:

当测试统计量是独立的时,可以获得相同的计算简便性。

在Benjamini和Hochberg的“控制错误发现率”(1995)中,作者写道:

定理1.对于独立的检验统计数据和任何虚假假设的配置,上述过程将FDR控制在q

后来,在2001年,Benjamini和Yekutieli写道:

1.3。问题。在实践中尝试使用FDR方法时,与独立测试统计数据相比,独立测试统计数据的出现频率更高,上述的多个端点示例就是一个很好的例子。

这些作者使用的独立人有哪些特殊含义?如果能伴随一种简单的语言解释,使测试相互依赖或独立的正式定义,我将很高兴。

我可以想到几种可能的含义,但是我不太理解,这可能是:

  • “因变量”是指多元检验(即许多具有相同或相似预测变量的因变量);自变量是指单变量检验(即,许多自变量,一个因变量)。

  • “从属”是指基于配对/匹配的受试者的测试(例如配对的t检验,重复测量方差分析等);“独立”是指未配对/独立的样本研究设计。

  • “从属”是指一项测试被拒绝的概率与另一项测试被拒绝的概率相关,而“正相关性”是指该相关为正。“独立”是指拒绝概率是不相关的。

参考文献
Benjamini,Y。和Hochberg,Y。(1995)。控制错误发现率:一种实用且强大的多重测试方法皇家统计学会杂志。系列B(方法论),57(1):289–300。

Benjamini,Y.和Yekutieli,D.(2001)。依赖下多重测试中错误发现率的控制统计年鉴,29(4):1165-1188。

Holm,S.(1979年)。一个简单的顺序拒绝多重测试程序斯堪的纳维亚统计杂志,6(65-70):1979。


1
测试统计量是随机变量。在这种情况下,“独立”的含义与任何一组随机变量的含义完全相同。
whuber

感谢@whuber,您是否有机会将其放大为一个答案?:)
Alexis 2015年

Answers:


13

“多重比较”是基于一个以上测试的结果进行决策的一般问题的名称。问题的本质可以通过著名的XKCD“绿色软心豆豆”卡通清楚地表明,调查人员对软糖(20种不同颜色)的消费与痤疮之间的关联进行了假设检验。一个测试报告的p值小于,导致的结论是,“绿色糖豆引起痤疮。” 这个笑话是,p值,由设计,有1 / 20的小于机会,1 / 20,所以我们不仅要会期望看到的p值中较低的201个/201个/201个/2020 不同的测试。

漫画没有说的是这测试是基于单独的数据集还是基于一个数据集。20

201个/20201个-0.05200.361个-0.36=0.64

2020

(ANOVA通过其整体F检验来解决此问题。这是一种“全部统治”的比较:除非首先进行此F检验,否则我们将不信任组间比较。)

p1个p2pñññ他们成为一个单一的决定。否则,我们通常能做的最好的就是依靠近似边界(例如,这是Bonferroni校正的基础)。

独立随机变量的联合分布易于计算。因此,文献将这种情况与非独立情况区分开来。

因此,引用中“独立”的正确含义是独立随机变量的通常统计意义。


ñX1个Xμμ=0p1个μ=1个p2p1个p2


+1谢谢你!以方差分析为例,是否会发生在方差分析之后,所有可能的配对都经过测试的任何成对比较都将是“相关的”,还是仅是将组与另一组进行比较的情况?(我认为是前者,但想确定)。
亚历克西斯2015年

2
在方差分析中,残差的方差是根据所有数据估算的。因此,仅由于该原因,即使两个比较没有共同的组,任何两个比较也将(略)相关。当比较确实具有相同的组(例如“ A”与“ C”以及“ B”与“ C”)时,依存关系更加明显和明显。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.