从三向方差分析表中删除因子


14

在最近的一篇论文中,我安装了一个三向固定效果模型。由于其中一个因素并不重要(p> 0.1),因此我将其删除,并使用两个固定的效果和一个相互作用对模型进行了重新拟合。

我刚刚让裁判发表评论,引用一下:

时间不是三方方差分析的重要因素,本身也不是汇集时间因素的充分标准:关于此问题的标准文本(Underwood 1997)认为,非显着影响的p值必须为大于0.25才能合并一个因子的治疗水平。作者应在此处给出相关的p值,并参考Underwood 1997证明其合并的合理性。

我的问题是:

  1. 我从未听说过0.25规则。还有其他人吗?我可以理解的是,如果p值接近临界值,则无法删除该因素,但是拥有“规则”似乎有点极端。
  2. 这位裁判指出,Underwood 1997是标准文本。真假的啊?我从来没听说过。标准文本是什么(是否存在这样的东西)?不幸的是,我无法访问1997年的Underwood。
  3. 对裁判的任何建议。

背景:本文已提交给非统计期刊。当拟合三向模型时,我检查了交互作用。


p.25

2
psomethingppp

5
这将是对裁判的有趣回应:“我们感谢裁判的评论,但认为他们有点愚蠢”;)不错的评论。
csgillespie 2010年

Answers:


15

我猜问题中的安德伍德是生态实验(剑桥出版社,1991年)。它或多或少是生态科学中的标准参考文献,可能仅次于Zar,Sohkol和Rohlf(在我看来,这是三者中“最易读”的)

如果可以找到副本,则裁判所引用的相关部分在第273页的9.7中。对于不重要的因素,Underwood提出了建议的合并程序(因此,本身不是“规则” )。坦白地说,这是一个两步过程,但建议增加p = 0.25,以减少合并非重要因素时I型错误的可能性(因此,与“时间”无关)您的示例,可能是任何非信号因子)。

他本人引用Winer等人(1991年,《实验设计中的统计程序》, McGraw-Hill),实际上该程序似乎不是Underwood的。如果找不到Underwood的副本,可以尝试在这里。


4
+1不错的答案:明确,要点,有见识和权威。
ub

@Chris,您的意思是上面的“减少II型错误的可能性”(不是I型)吗?不从模型中去除因素的动机是为了防止低功率的研究允许去除真正的原因(即,得出变量的II型无效),同时还夸大了模型中剩余参数的表观效果与现在删除的变量相关。由于副作用会产生I型错误,也许Underwood建议保留影响来控制1型和II型错误,即最大化模型有效性?
2015年

10

我讨厌这种基于截止的规则。我认为这取决于设计以及您的先验假设和期望。如果您希望结果会随时间而变化,那么我想您应该保持时间不变,就像处理任何其他“阻碍”因素一样。另一方面,如果您在不同时间复制相同的实验,并且没有理由认为结果会随时间而变化,但希望检查情况是否如此,那么这样做后,几乎没有发现或没有证据表明其随时间变化时间,我想再抽出时间是完全合理的。

我以前从未听说过安德伍德。这可能是“生态学实验”(书名)的标准文本,但没有明显的原因是,在生态实验应该在这方面的任何其他实验的任何区别对待,所以把它看作“ 标准文本这个问题”似乎没有道理。


1
在实验之前,据信该因素将是重要的。但是,它被其他两个影响淹没了。我删除了该因素,因为保留该因素不会改变结论,只会使解释更难。
csgillespie 2010年

2
嗯,在那种情况下,我想我会保留它。我不明白为什么它会使解释变得更难,而且正如您所发现的,与为什么保留它相比,为什么解释它为什么更难解释!
一站式服务,2010年

我同意你的观点,尽管我不是100%同意。我很容易看到另一个裁判员建议您删除这一因素(这也是我刚才所说的生物统计学家的建议)。正如您所提到的,当它是灰色区域时,就不应该采用任意规则。如果我们想误导,我们永远也不会提及其他因素!完全不道德,但我怀疑这会发生。
csgillespie 2010年

1

请阅读Underwood及其中的参考文献,这不是规则,请阅读。实际上,此方法是在删除(或合并)模型中的“非重要”项时控制II型错误。如果删除的术语的显着性水平为0.06怎么办?您真的确定预期的MS不会由于该因素而增加效果吗?如果删除该术语,则假定由于该处理,预期的MS不包括附加效果,但必须在某种程度上防止II型错误!请原谅我的穷人,赶紧英语!

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.