样本数量不相等:何时退出


14

我正在同peer审查一篇学术期刊文章,作者写了以下内容作为不报告任何推论统计数据的理由(我确定了这两组的性质):

总共的2349(1.1%)的受访者25报道X。我们适当地避免提供将X组与Y组(其他2,324名参与者)进行统计学比较的分析,因为这些结果可能是偶然性所驱动,而这种结果很少见。

我的问题是,这项研究的作者是否有理由在比较群体方面有所作为?如果没有,我会向他们推荐什么?

Answers:


20

统计检验不对样本量做出假设。当然,对于各种测试(例如正态性),存在不同的假设,但是样本数量的相等性不是其中之一。除非所使用的测试在其他方面不合适(我现在无法想到问题),否则I 型错误率否则将不受组大小严重不相等的影响。而且,他们的措辞暗示(在我看来)他们相信会。因此,他们对这些问题感到困惑。

ntUz

ααβn1n2dNn1=n2n1n2dαβα=.05β=.20α您应该使用它以保持足够的电量。对于这种情况下的研究人员来说,这种方法在逻辑上是有效的选择,尽管我承认这种方法的奇特之处可能会使它在可能从未听说过这种事情的更大的研究社区中很难销售。


这是非常有用的。我还发现您对以下问题的回应:如何解释不同样本量的均值比较?对我自己对此问题的理解很有用。阅读您的回答后,我将向作者提出折衷权力分析的可能性(听起来很安全,他们并不熟悉),并且可能建议在有关权力关注的评论中更具体。
2014年

2
不客气,@ AaronD。我认为,您绝对应该鼓励他们至少更改其措辞,因为这可能会引起误解,或者暗示他们误解了该主题。我预计他们不会尝试进行折衷功效分析,但他们也可以仅报告描述性统计信息(均值和标准差)以及带有适当置信区间的效应量。
gung-恢复莫妮卡

6

尽管@gung的回答非常好,但我认为在观察千差万别的团体人数时,应该考虑一个重要问题。通常,只要满足测试的所有要求,组大小的差异就不重要。

但是,在某些情况下,不同的小组人数将对检验针对这些假设的违规行为的鲁棒性产生巨大影响。例如,经典的两样本不成对t检验假设方差同质性,并且只有在两组的大小相似(按数量级)时,才能够抵制违规。否则,较小的组中较高的方差将导致I型错误。现在,对于t检验,这并不是什么大问题,因为通常使用Welch t检验代替,并且不假设方差均匀性。但是,在线性模型中也会产生类似的效果。

总而言之,我想这绝不是统计分析的障碍,但是在决定如何进行时必须牢记这一点。


8
我认为问题的关键不是测试的适用性,而是测试的意义和可解释性。问题是指“受访者”。这强烈暗示了非零响应率的可能性。相对于研究规模,即使是很小的无反应率(百分之一的一小部分),相对于较小的亚组来说,也将是巨大的无反应率。这就质疑了这么小的亚组的代表性。结果,这对任何统计分析都是一个巨大的障碍。
whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.