参数样本量计算和非参数分析


12

我很好奇,是否有人有特定的参考文献(文本或期刊文章)来支持医学文献中使用参数化方法(例如,假设正态分布和测量值有一定差异)执行样本量计算的惯例。当使用非参数方法进行主要试验结果的分析时。

例如:主要结果是服用某种药物后的呕吐时间,已知其平均值为20分钟(标准差为6分钟),但分布明显偏右。样本数量的计算是使用公式根据上面列出的假设进行的

n(per-group)=f(α,β)×(2σ2/(μ1μ2)2)

哪里 f(α,β) 根据所需的变化 αβ 错误。

但是,由于分布的偏斜性,主要结果的分析将基于等级(非参数方法,例如Mann Whitney U检验)。

统计学家是否可以支持这种模式,还是应该进行非参数的样本量估算(以及如何进行估算)?

我的想法是,为了便于计算,可以进行上述练习。毕竟,样本量估算值仅仅是(已经做出了多个假设的估算值)所有这些估算值可能都略微(或非常不精确)。但是,我很想知道其他人的想法,特别是想知道是否有任何引用来支持这种推理方法。

非常感谢您的协助。

Answers:


4

对我来说听起来很狡猾。非参数方法几乎总是比参数方法涉及更多的自由度,因此需要更多数据。在您的特定示例中,Mann-Whitney检验的功效低于t检验,因此对于相同的指定功效和大小,需要更多数据。

对任何方法(非参数方法或其他方法)进行样本量计算的一种简单方法是使用引导方法。


5
我同意您的观点,尽管在设计RCT时进行的大多数样本量计算都是基于参数模型。我喜欢自举方法,但是似乎很少有研究依赖它。我刚刚找到这些论文可能是有趣:bit.ly/djzzeSbit.ly/atCWz3,而在相反的方向这个更胜一筹bit.ly/cwjTHe健康测量尺度。
chl

6
我同意引导方法。但是权力不是自由度的函数。在很多情况下,包括这一点,曼恩·惠特尼检验通常比t检验具有更大的功效。参见tbf.coe.wayne.edu/jmasm/sawilowsky_misconceptions.pdf。通常,当参数假设正确时,参数测试的功效会很好,但在违反这些假设时,参数测试的功效可能会更低(有时会大幅度降低),而好的非参数测试则保持其功效。
ub

@RobHyndman-很抱歉,要挖掘6年前的旧主题,但是我想知道您能否为您的最后一句话提供参考。如何使用自举方法进行样本量计算?我在这里假设我还没有收集数据(因为我想弄清楚要收集的数据),但是我知道我想要的功效,显着性水平和想要检测的效果大小。谢谢!
David White

好吧,我想这只有在您有初步研究可重采样的情况下才有效。对于没有先验知识的首次研究,似乎最好从正态分布(或如果理论上建议数据应以这种方式分布,则从不同的分布)计算效应量,并加一点以考虑可能的非正态性。进行一项研究后,您可以使用增强分析来计算样本量,以检测后续研究中的各种效应量。您甚至可以根据自举n的几个值来拟合效果大小与n的关系曲线。
David White

4

某些人似乎使用Pitman渐近相对效率(ARE)的概念来夸大通过使用样本量公式进行参数测试而获得的样本量。具有讽刺意味的是,为了进行计算,必须再次假设其分布...参见例如Mann-Whitney U检验的样本大小。文章结尾处的一些链接提供了一些指针,供您进一步阅读。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.