比例的两样本比较,样本大小估计:R vs Stata


10

比例的两样本比较,样本大小估计:R vs Stata

对于样本量,我得到了不同的结果,如下所示:

R中

power.prop.test(p1 = 0.70, p2 = 0.85, power = 0.90, sig.level = 0.05)

结果: ñ=160.7777 (因此161)。

Stata

sampsi 0.70 0.85, power(0.90) alpha(0.05)

结果: ñ=174 每组。

为什么会有所不同?谢谢。

顺便说一句,我在SAS JMP中运行了相同的样本量计算,结果:(几乎与R结果相同)。ñ=160

Answers:


7

差异是由于以下事实造成的:默认情况下,Stata的sampsi命令(从Stata 13起已弃用,并由代替power)使用连续性校正,而R power.prop.test()则不使用(有关Stata使用的公式的详细信息,请参见[PSS]二次幂比例)。可以使用以下nocontinuity选项进行更改,例如

sampsi 0.70 0.85, power(0.90) alpha(0.05) nocontinuity

每组样本量为161。使用连续性校正会产生更保守的检验(即,较大的样本量),并且显然随着样本量的增加而变得无关紧要。

Frank Harrell在bpower(属于Hmisc软件包的一部分)的文档中指出,不进行连续性校正的公式非常准确,从而为放弃校正提供了一些依据。


2
好答案。似乎不是我帖子中两种方法之间的差异是造成差异的原因,而是这些方法中的一种使用连续性校正而另一种则不是。
Michael M

1
谢谢。仅使用两个比例(即2x2表格),将替代项指定为两个比例还是一个比例和几率就没有关系。并且由于Fisher精确检验对于二样本二项式问题很保守,因此基于此的功效估计更接近于连续性校正公式的功效估计。
Phil Schumm 2013年

1
谢谢@pschumm。我试图Hmisc包的bsamsize(0.70, 0.85, alpha=0.05, power=0.90),并得到ñ1个=ñ2=160.7777
dwstu 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.