背景:请安全跳过-在此仅供参考,并将问题合法化。
本文开头为:
“卡尔·皮尔森(Karl Pearson)著名的卡方偶发性测验是基于正态分布,从另一个称为z统计量的统计量得出的。的最简单版本可以证明在数学上等同于等效z检验。在所有情况下,结果都是相同的。对于所有意图和目的,“卡方”都可以称为“ z平方”。一个自由度的的临界值是z的相应临界值的平方。
而事实上,我们可以证明该相当于与:
假设且并使用cdf方法求出的密度:
。问题是我们不能以正态分布的密度紧密结合。但是我们可以表达它:
由于普通pdf的值是对称的:
。这等同于正常的(即现在的在将,以被插入到正常的一部分); 并记住最后要包含:
与卡方的pdf相比:
由于,对于 df,我们精确地得出了卡方的。 1个pd˚F
此外,如果我们prop.test()
在R中调用该函数,我们将调用相同的测试,就像我们决定一样。chisq.test()
问题:
所以我得到了所有这些要点,但是由于两个原因,我仍然不知道它们如何应用于这两个测试的实际实现:
Z检验不平方。
实际的测试统计数据完全不同:
的test-statistic的值为:
,其中
=皮尔森的累积检验统计量,渐近地接近分布。 =类型的观测数; =观察总数; = =类型的预期(理论)频率,由零假设得出,即种群中类型的分数为 ; =表中的单元格数。ø 我我Ñ Ë 我 Ñ p 我我我p 我 Ñ
另一方面, -test 的测试统计量为:
其中,其中和是“成功”的数量,超过分类类别中每个级别的主题数变量,即和。
该公式似乎依赖于二项式分布。
这两个测试统计显然是不同的,并导致不同的结果进行实际测试统计数据,以及作为p -值:5.8481
对于和用于z测试,其中(谢谢@ mark999)。所述p为-值测试,而用于z测试。用两尾和一尾来解释的差异:(谢谢@amoeba)。2.4183
0.01559
0.0077
那么,我们在多大程度上说它们是相同的呢?
chisq.test()
,您是否尝试过使用correct=FALSE
?