计算统计功效


22

据我了解,我需要至少了解我提出的研究的三个方面(四个),以便进行功效分析,即:

  • 测试类型-我打算使用Pearson's r和ANCOVA /回归-GLM
  • 显着性水平(alpha)-我打算使用0.05
  • 预期效果大小-我打算使用中等效果大小(0.5)
  • 样本量

谁能推荐一个好的在线功率计算器,我可以用它进行事前功率计算。(SPSS可以进行先验功率计算吗?)

我遇到过GPower,但我正在寻找一种更简单的工具!


不幸的是,SPSS软件包不包含用于功率分析的模块。IBM SPSS公司出售单独的程序以进行功耗分析。
ttnphns 2012年

6
我会给GPower一个机会。经过20或30分钟的探索,您可能会发现它非常易于管理-至少对于诸如相关性之类的过程而言,对于复杂的回归模型而言并不一定。
rolando2 2012年

谢谢!GPower上是否有易于使用的指南?
Adhesh Josh 2012年

这看起来像是用于赠款申请的。这些令人烦恼,难以产生和评估。对于良好使用的实验设计(例如,全基因组关联研究),可能有记录良好的专用计算器。否则,我认为G. Jay Kerns的答案是添加以下内容的正确方法:在使用该功能时,您应该模拟一系列最重要的参数并显示一个图形。
Leo Schalkwyk,2012年

Answers:


43

恐怕这不是您要听到的答案,但无论如何我还是要说:尝试抵制在线计算器的诱惑(在购买专有计算器之前省钱)。

原因如下:1)在线计算器都使用不同的符号,并且经常没有很好的文档记录。这是浪费您的时间。2)SPSS确实提供了功率计算器,但我从未尝试过,因为它对于我的部门来说太昂贵了!3)诸如“中等效应大小”之类的短语充其量会误导他人,最糟糕的是,除了最简单的研究设计之外,所有其他错误都是显而易见的。参数太多,相互作用太多,无法将效果大小精简为[0,1]中的单个数字。即使您可以将其放在一个数字中,也不能保证在问题的背景下Cohen的0.5对应于“中”。

相信我-从长远来看,最好是硬着头皮,并教给自己如何使用仿真以达到自己的利益(以及所咨询人员的利益)。与他们坐下并完成以下步骤:

1)确定适合于问题背景的模型(听起来像您已经在此部分上工作的一样)。

2)与他们协商,以决定空参数应该是什么,控制组的行为,这在问题的上下文中意味着什么。

3)与他们协商确定参数应该是什么,以使差异在实际中有意义。如果样本数量有限,则也应在此处进行标识。

4)根据2)和3)中的两个模型模拟数据,然后运行测试。您可以使用软件galore做到这一点-选择您喜欢的并继续。看看您是否拒绝。

ñp^p^1个-p^/ñ

如果以这种方式进行功率分析,则会发现以下几件事:A)运行的参数比您预期的要多得多。这将使您想知道在世界上如何将它们全部折叠成一个单一的数字(例如“ medium”),并且您会发现这是不可能的,至少不是以任何直接的方式。B)您的能力将比其他许多计算器所宣传的要小得多。C)您可以通过增加样本量来增加功效,但要当心!您可能会发现,为了检测出“实际上有意义的”差异,您需要的样本量过大。

如果您在执行上述任何步骤时遇到问题,可以收集您的想法,为CrossValidated精心设计一个问题,这里的人员将为您提供帮助。

编辑:在您发现绝对必须使用在线计算器的情况下,我发现的最好的计算器是Russ Lenth的功效和样本量页面。它已经存在很长时间了,它具有相对完整的文档,它不依赖于罐装效果大小,并且具有与其他相关且重要的论文的链接。

另一个编辑: 碰巧,当这个问题出现时,我正写一篇博客文章充实其中的一些想法(否则,我可能没有这么快就回答了)。无论如何,我上周末完成了它,您可以在这里找到它。它不是在考虑SPSS的情况下编写的,但是我敢打赌,如果一个人很聪明,他们也许能够将其部分内容转换为SPSS语法。


8
+1好答案。值得指出模拟的缺点。(另一种方法是可以通过数学方式计算功效曲线。)当必须操纵许多参数(例如效果大小和样本大小)或当您寻求某个阈值(例如最小样本大小)时,仿真变得笨拙。甚至对于功率的近似精确表达式对于总体上指示功率如何表现以及确定可以通过一点点模拟就能完善的初始解也很有价值。
ub

2
@whuber谢谢,您绝对正确。您的评论提醒我,null / alt参数(扫描信息,糟糕的飞行员研究等)通常存在更多不确定性,这给模拟方法增加了另一层复杂性。这是数学方法的另一个好处。

2
除了固定未知参数的值之外,还可以通过在这些参数上分配先验分布然后获得“先验功率”来模拟它们,这很有用(尽管有先验分布的概念,这不是贝叶斯方法,因为我们模拟频率论测试的结果)
斯特凡洛朗

6
模拟存在两个问题:学习模拟(此模拟是可解决的)并完成步骤3。以我的经验,我的客户都不愿意做3)。许多人很难指定任何效果大小。要求他们在(例如)多元回归方程中指定参数将是..嗯,他们不知道如何回答,即使他们知道含义,也不愿指定。
彼得·弗洛姆

2
Stephane是的,您是对的,这就是我试图交流的额外层的意思。@彼得 叹气!是的,我也遇到过这种情况。我尝试谈论均值,标准错误等,然后尽力而为。其中一部分是沟通障碍,有时这是一个挑战。不过,不愿接受的部分更加艰难。过去,我会自己放弃并尝试填补空白,但是效果却很少。也就是说,答案本质上是在黑暗中开枪,蒙上眼罩并向后站立。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.