了解卡方检验和卡方分布


13

我试图理解卡方检验背后的逻辑。

卡方测试是χ2然后比较卡方分布,找出一个p.value以拒绝或不零假设。H0:观测值来自我们用来创建期望值的分布。例如,我们可以测试获得概率是否如我们预期的那样由p给出。所以我们翻转100次,发现ñ^ h1-ñ^ h。我们希望我们的发现比较预期是什么(100p)。我们也可以使用二项式分布,但这不是问题的重点……问题是:χ2=(obsexp)2expχ2H0headpnH Heads1nH tails100p

您能否解释一下为什么在零假设下遵循卡方分布吗?(obsexp)2exp

关于卡方分布,我所知道的是,度的卡方分布是k平方标准正态分布的总和。kk


2
它不是:这是一个近似值。(更多)关于此的更多信息出现在stats.stackexchange.com/questions/16921/…的线程中。
ub


关于为什么使用卡方分布进行拟合优度测试(尽管不是完全重复)的一个相关问题:stats.stackexchange.com/questions/125312/…–
Silverfish

Answers:


12

我们也可以使用二项式分布,但这不是问题的重点……

但是,即使您遇到实际问题,这也是我们的出发点。我会非正式地介绍一下。

让我们更一般地考虑二项式情况:

YBin(n,p)

npYmin(np,n(1p))np(1p)

然后将近似为。这里是成功的次数。(YE(Y))2/Var(Y)χ12Y

我们有和。E(Y)=npVar(Y)=np(1p)

(在测试用例中,已知,并且在下指定。我们不做任何估算。)npH0

因此大约为。(Ynp)2/np(1p)χ12

注意。另请注意,。(Ynp)2=[(nY)n(1p)]21p+11p=1p(1p)

因此(Ynp)2np(1p)=(Ynp)2np+(Ynp)2n(1p)=(Ynp)2np+[(nY)n(1p)]2n(1p)=(OSES)2ES+(OFEF)2EF

这只是二项式情况的卡方统计量。

因此,在那种情况下,卡方统计量应具有(大约)标准正态随机变量的平方分布。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.