卡方总是单方面测试吗?


48

发表的文章(pdf)包含以下两个句子:

此外,误报可能是由于使用了不正确的规则或对统计检验知识的缺乏所致。例如,可以将ANOVA中的总df视为检验报告中的误差df ,或者研究人员可以将或检验的报告p值除以2,以获得片面的值,而 a的值或测试已经是一个单侧检验。χ 2 ˚F p p χ 2 ˚FFχ2Fppχ2F

他们为什么这么说?卡方检验是一种双面检验。(我问过其中一位作者,但没有得到答复。)

我在俯视什么吗?


请看Davidson&Mackinnon的“计量经济学理论和方法” 2004版的练习4.14,其中有一个(特殊的)示例,说明了使用卡方检验进行双尾检验的情况。编辑:很棒的解释在这里:itl.nist.gov/div898/handbook/eda/section3/eda358.htm
Max

Answers:


50

卡方检验本质上始终是单面检验。这是一种思考的宽松方法:卡方检验基本上是一种“拟合优度”检验。有时,它被明确地称为“合适”,但即使不是这样,从本质上讲,它仍然通常是合适的。例如,在2 x 2频率表上的卡方独立性检验是对第一行(列)与第二行(列)指定的分布的拟合度的检验(某种程度上),反之亦然, 同时。因此,当已实现的卡方值在其分布的右尾处偏离时,表明拟合程度较差,如果距离足够远(相对于某个预先指定的阈值),我们可能会得出结论,它是如此之差,以至于我们不认为数据来自该参考分布。

如果我们将卡方检验用作双面检验,我们也将担心统计量是否离卡方分布的左侧太远。这将意味着我们担心拟合度可能太高。这根本不是我们通常担心的事情。(作为一个历史性的旁注,这与孟德尔是否捏造了他的数据的争议有关。想法是他的数据太好了以至于无法实现。如果您好奇的话,请参见此处获取更多信息。)


9
+1代表孟德尔豌豆实验的两面用法:令人难忘,并成为问题的核心。
ub

2
+1是一个很好的问题和一个很好的答案。@Joel W:我可以强烈推荐测试中的 Khan Academys视频χ2
Max Gordon

9
我对此的总结是是一个双面检验,我们通常只对分布的一条尾巴感兴趣,这表明更多的分歧,而不是比偶然的期望少的分歧。χ2
Frank Harrell'2

5
支持2尾视图:“对于标准正态分布,超出+/- z的两尾概率等于df = 1的卡方分布的z平方以上的右尾概率。例如,两当df = 1时,尾随的标准正态概率0.05低于-1.96且低于1.96等于右尾卡方概率大于(1.96)平方= 3.84。” Agresti,2007年(第2版)第11页
Joel W.

5
那就对了。对z分数求平方可得出卡方变量。例如,z的平方等于2(或-2!)等于4,即对应的卡方值。z得分为2的双尾p值为.04550026;与卡方值4(df = 1)相关的单尾p值为.04550026。2尾z检验对应于1尾卡方检验。查看卡方分布的左尾将对应于寻找比您偶然期望的z = 0更接近的z得分。
gung-恢复莫妮卡

12

卡方总是单方面测试吗?

这实际上取决于两件事:

  1. 正在检验什么假设。如果要针对指定值测试正常数据的方差,则很有可能要处理卡方(单尾)的上尾或下尾,或分布的两个尾。我们必须记住,类型统计数据并不是镇上唯一的卡方检验!(OE)2E

  2. 人们是在谈论替代假设是单面的还是双面的(因为某些人使用“两尾”来指代双面替代,而与统计数据的抽样分布无关)。有时因此,例如,如果我们正在研究两个样本的比例测试,则有人可能会在空值中写出这两个比例相等,而在另一种情况下可能写出| T |π1π2然后将其称为“双尾”,但使用卡方而不是z检验对其进行测试,因此仅查看检验统计量分布的上尾部(因此在在样本比例的差别,但一个从所获得的卡方统计量的分布方面尾的分布-在几乎相同的方式,如果你让你的t检验statistc,你只能是看着的分布中的一条尾巴。|T||T|

就是说,我们必须非常小心使用“卡方检验”来涵盖什么意思,并且要精确地讲出“单尾”与“两尾”的含义。

在某些情况下(我提到过两个;可能还会更多),将其称为两尾也许是很有意义的,或者,如果您接受一些宽松的术语使用,则将其称为两尾也许是合理的。

如果将讨论限制在特定种类的卡方检验中,那可能是一个合理的说法。



非常感谢您提到方差检验。这实际上是测试的一个非常有趣的用法,也是我最终在此页上结束的原因^^
Tobbey

5

方差为的假设的卡方检验可以与t检验平均值为的假设的可以是一尾还是二尾。σ 2- μ (n1)s2/σ2σ2μ(mμ)n/sμ


1

@gung的答案是正确的,这是应该阅读讨论的方式。但是,另一种解读可能会引起混乱:χ2

这将是容易理解一个在这个意义上,检验统计量一般由从差的平方和的“双面” 两者的原始分布的两侧。χ2

该读数将是混淆检验统计量是如何与尾部产生检验统计量正在看着。


您能否详细说明“原始发行版的一面”?甚至不清楚“原始分布”指的是什么,也不知道它与根据数据计算出的卡方统计量有何关系。
ub

例如,独立法线平方的总和为。正态分布是“原始”分布。所述 STAT结合从底层正态分布的两个尾部信息。χ 2 χ 2nχ2χ2
推测

好的,但是我仍然无法弄清您与之对比的地方。您能否提供一个可以在ANOVA中使用的非双向检验统计数据的示例,并说明它如何与某些分布的尾部联系在一起?
ub

我没有将它与任何事物进行对比。我要指出的是为什么人们可能会在的上下文中对单面/双面术语感到困惑。专家可以很容易地看出测试本身通常是对计算出的统计信息进行的单面测试。其他人可能有一些数据,并正在考虑两个方向上均值的偏差,这些偏差通常汇总为统计量。他们将听到“思考双向均值的偏差=双向检验”的思路。因此产生了误会。χ 2 χ 2χ2χ2χ2
推测2015年

我要求对比只是为了帮助理解您要描述的内容。我还无法确定那是什么。
ub

0

我也有一些问题需要解决,但是经过一些试验,似乎我的问题只是在于测试的命名方式。

以SPSS为例,一个2x2表格可以添加一个卡方检验。有两列用于p值,一列用于“ Pearson Chi-Sqare”,“连续性校正”等,另一对用于Fisher精确检验的列,其中一列用于2面检验,另一列用于a侧检验。 1面测试。

我首先认为1面和2面表示卡方检验的1面或2面版本,这似乎很奇怪。然而,事实证明,这表示在比例之间的差异检验(即z检验)中替代假设的基本表述。因此,在SPSS中使用卡方检验可实现通常合理的比例两面检验,将卡方度量与分布的(一面)上尾巴中的值进行比较。猜猜这就是对原始问题的其他回答已经指出的内容,但是我花了一些时间才意识到这一点。

顺便说一句,openepi.com甚至其他系统也使用了相同的配方。



0

Ñ - 1 s ^ 2χ2 方差检验可以是一侧或两侧:检验统计量是,并且零假设是:s(样本偏差)=(参考值)。替代假设可能是:(a),(b),(c)。p值计算涉及分布的不对称性。 σ小号>σ小号<σ小号σ(n1)s2σ2σs>σs<σsσ


1
欢迎来到简历!我认为Ray Koopman的答案已经涵盖了这一点。
银鱼

-1

所述个F测试是一个双侧检验,因为从来没有具有负值和F.对于,观察到的差异的总和和预期的平方由预期的(一个划分比例),因此卡方始终为正数,或者在无差异时右侧可能接近零。因此,该测试始终是右侧单面测试。F检验的解释与此类似。χ 2 χ 2χ2χ2χ2

对于F检验,我们将组方差与组内方差之和进行比较(均方误差为。如果均方差和均方差相等,则F值为1。SSwdfw

由于本质上是平方和之比,因此该值永远不会成为负数。因此,我们没有左侧测试,而F测试始终是右侧测试。检查和F分布的数字,它们始终是正数。对于这两个检验,您都在查看计算的统计量是否位于临界值的右侧。 χ2

卡方和F分布


1
检验统计量不需要取负值即可让我们考虑两条尾巴。例如,考虑对两个方差之比进行F检验。
Glen_b

F测试是单面测试Glen_b。
丹尼尔(Daniel)

3
方差相等性的F检验,具有两个方差估计值之比不是单边的统计量;有一个近似值,它将两个样本方差中较大的一个放在分子上,但是只有在df相同的情况下才是正确的。但是,如果您不喜欢它,那么还有许多其他示例。秩和检验的统计数据不能为负,但检验为两个尾数。如果需要,我可以提供其他示例。
Glen_b

@Ferdi不幸的是,那里的示例显然有问题-它说是两面的,但随后意味着它仅拒绝了较大的统计值。如果小于我们几乎永远不会观察到较大的比率值,因此,仅当时,统计信息才会倾向于拒绝。 σ 2 2 σ 2 1 > σ 2 2σ12σ22σ12>σ22
Glen_b
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.