关于t检验的正态假设的问题


9

对于t检验,根据大多数文献,假设人口数据呈正态分布。我不知道为什么。t检验不是只要求样本均值的抽样分布是正态分布,而不是总体吗?

如果情况是t检验最终只要求样本分布具有正态性,那么总体可以看起来像任何分布,对吗?只要样本数量合理即可。那不是中央极限定理所陈述的吗?

(我在这里指的是一个样本或独立样本的t检验)


1
好吧,样本均值作为随机变量只能在单个部分也正常的情况下才是正常的。但是您是正确的:t检验是渐近非参数的(无正态分布),但组内方差(在两个样本的情况下)仍应相似且存在。
Michael M

通过组内方差相似,您是指方差均质性的假设吗?如果是这样,那么welch的t检验对此正确吗?
彼得·纳什

对,就是这样。如果韦尔奇的校正自由度达到无穷大,那么他的程序也将是无分布的(但是需要引用...)。
Michael M

Answers:


9

对于t检验,根据大多数文献,假设人口数据呈正态分布。我不知道为什么。t检验不是只要求样本均值的抽样分布是正态分布,而不是总体吗?

t统计量由两个量的比率组成,两个量均为随机变量。它不仅由分子组成。

为了使t统计量具有t分布,您不仅需要样本均值具有正态分布。您还需要:

  • 在分母是使得š 2 / σ 2χ 2 d *ss2/σ2χd2

  • 分子和分母是独立的。

*(的值取决于哪个测试-在一个样本t中,我们有d = n 1dŤd=ñ-1个

为了使这三个事实真正成立,您需要原始数据呈正态分布。

如果情况是t检验最终只要求样本分布具有正态性,那么总体可以看起来像任何分布,对吗?

让我们先考虑一下iid。为了使CLT能够容纳人口,必须满足条件……-人口必须具有适用CLT的分布。不能,因为有些人口分布不适用于CLT。

只要样本数量合理即可。那不是中央极限定理所陈述的吗?

不,CLT实际上对“合理的样本量”一字不漏。

实际上,对于任何有限样本量所发生的情况,它什么也没说。

ñ=1015ñ


所以你有两个问题:

答:人们通常归因于CLT的影响-在小/中样本量下,越来越接近地接近样本均值的正态分布的方法-实际上并未在CLT中说明**。

B.“在分子中与正常值相差不远的东西”不足以使统计量具有t分布

**(类似Berry-Esseen定理的东西会让您更像人们看到的那样,当他们看到样本数量增加对样本均值分布的影响时。)


ññ


1
为了使这三个条件[样本均值的正态性,样本方差的卡方性和两者的独立性]真正成立,您需要原始数据呈正态分布。您是说只有法线才具有这三个属性吗?我不是在说这个陈述是错误的,只是想知道那是不是你在说什么。
Andrew M

2
@AndrewM当然只有普通人将这三个全部在一起。此外,仅第一个或第三个就足以暗示法线-第三个代表法线(Lukacs,1942),对于有限数量的独立随机变量,只有法线才具有第一个(Cramér分解定理)。可以想到还有其他方法来获得第二个,但我还不知道。
Glen_b-恢复莫妮卡

关于第二点,@ AndrewM,Ahsanullah(1987,1989)的工作可能是相关的。
Glen_b-恢复莫妮卡

1
X一个X一个
安德鲁M

@AndrewM区别在于您引用的结果不依赖于独立性,而Cramer的结果依赖于独立性。它们在它们的位置都很有用。
Glen_b-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.