@jbowman给了您一个不错的选择。我想我可能会提供一些有关您关于 -test和测试是否适当的明确问题的信息。 χ 2zχ2
z -test:
关于使用检验的适当性有两个问题,都与假定的采样分布是否正确有关。首先,检验使用正态分布而不是分布,这意味着标准偏差是已知的,没有采样误差。其次,采样分布是连续的,但数据是离散的。由于只有某些数据组合才有可能,因此只有某些最终实现的测试统计值才有可能,这可能与理论采样分布不太匹配。(我在这里在其他测试的背景下讨论了这个问题:比较和对比,p值,显着性水平和I类错误。) zzt
让我们在不同的上下文中考虑第一个问题。如果您有两组具有正态分布数据的数据,并且想要查看均值是否相等,则需要计算均值和标准差。现在我们知道这些均值会受到抽样误差的影响,这就是为什么我们需要进行测试而不是仅仅说这两个样本均值不相同的原因。但是,我们对标准偏差的估计也必须受到抽样误差的影响,我们必须以某种方式考虑这一事实。当我们这样做时,事实证明检验统计量(一种按比例划分的均值差)分布为。如果我们改用正态分布(即tz-test),这意味着我们假设我们对标准偏差的估算没有错误-完美无缺。那么为什么要在您的情况下使用 -test?原因是您的数据是二项式的(即已知“试验”总数中的“成功”数),而不是正常的。在二项分布中,标准差是平均值的函数,因此一旦您估算了平均值,就不必担心其他不确定性了。因此,正态分布可以用作检验统计量抽样分布的模型。 z
尽管使用正态分布来了解测试统计信息的长期行为在技术上是正确的,但仍然出现了另一个问题。问题在于正态分布是连续的,但是由于您的数据是离散的,因此可能无法在数据集中找到理论分布中的所有值。(再次,我在上面的链接的答案中详细讨论了这个问题。)幸运的是,您的越大,数据的可能结果与理论正态采样分布之间的匹配越好。就您而言,无论真正的基础概率是多少,每个组中可以有多达全部成功或只有一个成功。这意味着可能的组合数为N91×91=1,729,这有很多可能性。使用一个很小的数据集,您确实会遇到我在链接的答案中讨论的一些问题,但是当,您不必担心太多。我相信检验对研究人员是一个有效的选择。 N=180z
χ2 -test:
但是 -test呢?我认为这也是一个有效的选择,但这不是我的首选。(让我顺便说一句,上面讨论的第二个问题-离散数据和连续参考分布之间的不匹配-应用于 -test和应用于 -test一样多,因此存在这里没有优势。)χ2χ2zχ2-test是它不假设相对于行总计,列总计没有任何特殊之处;都将它们视为可能是其他可能的值。但是,这不能准确反映实验设置。共有180人,每个小组分配了90人。在重复的相同研究中唯一真正不同的是每个组中感冒的人数。该 -测试错误地将感冒的数量和人的各组,虽然他们可能会有所不同的数量,但 -测试做出正确的假设。这就是 -test在此处具有更大功能的原因。 χ2zz
值得一提的是,@ jbowman建议的置换测试也可以很好地解决您的设计问题,并且不会遭受离散连续不匹配问题的困扰。因此,这是最佳选择。但是我认为您可能想了解更多有关和测试在您的情况下进行比较的信息。 zχ2