我有两个组的数据(即样本),我想进行比较,但是总样本量很小(n = 29)并且严重不平衡(n = 22 vs n = 7)。
这些数据在逻辑上很难收集,而且费用昂贵,因此,“收集更多数据”作为一种明显的解决方案在这种情况下并没有帮助。
测量了许多不同的变量(出发日期,到达日期,迁移时间等),因此有多个测试,其中一些差异非常大(较小的样本具有较高的差异)。
最初,一位同事对这些数据进行了t检验,其中一些在统计学上具有显着性,P <0.001,而另一个在P = 0.069上不显着。一些样本是正态分布的,而其他样本则不是。一些测试涉及与“相等”方差的较大偏差。
我有几个问题:
- T检验在这里合适吗?如果没有,为什么?这仅适用于满足正态性和方差相等的假设的测试吗?
- 什么是合适的替代品?也许是排列测试?
- 不相等的方差会夸大类型I的错误,但是怎么办?小而不平衡的样本量对I型错误有什么影响?