在什么级别上,检验在数学上与比例的检验相同?


15

背景:请安全跳过-在此仅供参考,并将问题合法化。

本文开头为:

“卡尔·皮尔森(Karl Pearson)著名的卡方偶发性测验是基于正态分布,从另一个称为z统计量的统计量得出的。的最简单版本可以证明在数学上等同于等效z检验。在所有情况下,结果都是相同的。对于所有意图和目的,“卡方”都可以称为“ z平方”。一个自由度的的临界值是z的相应临界值的平方。χ2χ2

这已在CV中多次声明(此处此处此处及其他)。

而事实上,我们可以证明该相当于与:χ1df2X2XN(0,1)

假设且并使用cdf方法求出的密度:XN(0,1)Y=X2Ycdf

p(Yy)=p(X2y)=p(yxy)。问题是我们不能以正态分布的密度紧密结合。但是我们可以表达它:

FX(y)=FX(y)FX(y).
取导数:

fX(y)=FX(y)12y+FX(y)12y.

由于普通pdf的值pdf是对称的:

fX(y)=FX(y)1y。这等同于pdf正常的(即现在的xpdfy,以被插入到ex22正常的一部分pdf); 并记住最后要包含1y

fX(y)=FX(y)1y=12πey21y=12πey2y121

与卡方的pdf相比:

fX(x)=12ν/2Γ(ν2)ex2xν21

由于,对于 df,我们精确地得出了卡方的。 1个pd˚FΓ(1/2)=π1pdf

此外,如果我们prop.test()在R中调用该函数,我们将调用相同的测试,就像我们决定一样。χ2chisq.test()

问题:

所以我得到了所有这些要点,但是由于两个原因,我仍然不知道它们如何应用于这两个测试的实际实现:

  1. Z检验不平方。

  2. 实际的测试统计数据完全不同:

test-statistic的χ2值为:

χ2=i=1n(OiEi)2Ei=Ni=1npi(Oi/Npipi)2 ,其中

χ2 =皮尔森的累积检验统计量,渐近地接近分布。 =类型的观测数; =观察总数; = =类型的预期(理论)频率,由零假设得出,即种群中类型的分数为 ; =表中的单元格数。ø Ñ Ë Ñ p p Ñχ2OiiNEiNpiiipin

另一方面, -test 的测试统计量为:z

Z=x1n1x2n2p(1p)(1/n1+1/n2)其中,其中和是“成功”的数量,超过分类类别中每个级别的主题数变量,即和。p=x1+x2n1+n2x1x2n1n2

该公式似乎依赖于二项式分布。

这两个测试统计显然是不同的,并导致不同的结果进行实际测试统计数据,以及作为p -值5.8481对于和用于z测试,其中(谢谢@ mark999)。所述p为-值测试,而用于z测试。用两尾和一尾来解释的差异:(谢谢@amoeba)。χ22.41832.41832=5.84817χ20.015590.00770.01559/2=0.007795

那么,我们在多大程度上说它们是相同的呢?


但是,这是两个相同的测试。Z平方是卡方统计量。让您有一个2x2频率表,其中列是两组,行是“成功”和“失败”。然后,将给定列中所谓的卡方检验的期望频率乘以加权(按组的N值)平均列(组)配置文件乘以该组的N值。因此,卡方检验得出了从该平均组配置文件中得出两个组配置文件中的每个-相当于测试组的配置文件彼此之间的差异,即比例的z检验。
ttnphns

在最后一个超链接的示例中,几乎是z检验统计量的平方,但不完全相同,并且p值不同。另外,当您查看上面其余统计信息的公式时,它们是否真的相同就立即生效?甚至是另一个的平方?χ2
Antoni Parellada 2015年

2
在中chisq.test(),您是否尝试过使用correct=FALSE
mark999 2015年

1
确实,安东尼。两种测试都有或没有耶茨存在。难道您有一个计算而另一个没有计算呢?
ttnphns

1
谢谢!你是(正确的)正确的。取消Yates校正后,一个就是另一个的平方。虽然有点快,但我还是相应地编辑了问题。我仍然想以代数方式证明两个检验统计量是相同的(或一个是另一个的平方),并理解为什么p值不同。
安东尼·帕雷拉达

Answers:


12

让我们有一个2x2频率表,其中列是两组响应者,行是两个响应“是”和“否”。我们已经将频率转换为组内的比例,即转换为垂直轮廓

      Gr1   Gr2  Total
Yes   p1    p2     p
No    q1    q2     q
      --------------
     100%  100%   100%
      n1    n2     N

在用比例代替公式中的频率代替后,此表的常用值(未校正Yates的)看起来像这样:χ2

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2+n2(p2p)2pq.

请记住,,这两个配置文件和的加权平均配置文件的元素,并将其插入公式中,以获得p=n1p1+n2p2n1+n2(p1,q1)(p2,q2)

...=(p1p2)2(n12n2+n1n22)pqN2

将分子和分母除以并得到p 1 - p 2 2(n12n2+n1n22)

(p1p2)2pq(1/n1+1/n2)=Z2,

“是”响应的比例z检验的平方z统计量。

因此,2x2同质性卡方统计量(和检验)等同于两个比例的z检验。在给定列中的卡方检验中计算的所谓期望频率是加权(按组n)平均垂直轮廓(即“平均组”的轮廓)乘以该组的频率n。因此,得出的结果是,卡方检验了两组平均轮廓与该平均轮廓之间的偏差,这等效于检验各组彼此之间的差异,这是比例的z检验。

这是变量关联度量(卡方)和组差异度量(z检验统计量)之间联系的一个例证。属性关联和组差异是(通常)同一事物的两个方面。


(根据@Antoni的要求,在上面的第一行中显示扩展):

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2qpq+n1(q1q)2ppq+n2(p2p)2qpq+n2(q2q)2ppq=n1(p1p)2(1p)+n1(1p11+p)2p+n2(p2p)2(1p)+n2(1p21+p)2ppq=n1(p1p)2(1p)+n1(pp1)2p+n2(p2p)2(1p)+n2(pp2)2ppq=[n1(p1p)2][(1p)+p]+[n2(p2p)2][(1p)+p]pq=n1(p1p)2+n2(p2p)2pq.


@ttnphs太好了!您有机会澄清第一个公式()公式中的中间步骤-我看不出等号后消失了。 qχ2q
Antoni Parellada 2015年

@ttnphs展开它时,我得到n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(q(p2+p(2p12q1+p12)+p(q2+q12)pq)+n2(q(p2+p(2p22q2)+p22)+p(q2+q22)pq)
安东尼·帕雷拉达

@ttnphs ...或参考一下,所以键入胶乳的工作量更少...我将迅速而愉快地“接受”答案...
Antoni Parellada 2015年

@Antoni,已插入扩展。
ttnphns

@ttnphns太棒了!
Antoni Parellada 2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.