“反转”的夏皮罗-威尔克


11

根据维基百科,Sharipo-Wilk检验测试零假设()“总体呈正态分布”。H0

我正在寻找类似的正态性检验,其 “总体不是正态分布”。H0

具有这样的试验中,我要计算一个 -值拒绝ħ 0在显着性水平α IFF p < α ; 证明我的人口呈正态分布。pH0αp<α

请注意,使用Sharipo-Wilk检验并接受 iff p > α不正确的方法,因为这从字面上意味着“我们没有足够的证据证明H0不成立”。H0p>α

相关线程-p -value的含义p正常性测试没用吗?,但看不到我的问题的解决方案。

问题:我应该使用哪种测试?它在R中实现吗?


6
不能使用“非正态分布”的零假设。该空间将包括所有接近但不完全接近正态分布的分布。您给我任何有限的数据集。我选择了经验分布,它不是正态的,因此属于零空间。无法拒绝。
A. Webb

5
这个问题与您前面的问题相同,要求不可能。正确的答案将解释统计假设检验的工作原理,这就是为什么我在评论您其他问题的过程中将您指向stats.stackexchange.com/questions/31
呜呜叫声

5
尽管不可能没有“不正态分布”的零假设,但按照等效检验的思路,“正态拟合优度统计的绝对值的分布至少与 ” 的零假设似乎是合理的。换句话说,一个人应该能够对“非正常值至少如此之高 ” 进行测试。@gung在他的回答中恰好建议了这一点。ε
亚历克西斯(Alexis)2015年

Answers:


10

没有可以测试您的数据是否正常分布的测试。只有测试证明您的数据不是正态分布的。因此,存在像Shapiro-Wilk这样的测试,其中(有许多其他的),但没有测试,其中空的是,人口是不正常的和替代的假设是,人口是正常的。 H0:normal

您所能做的就是弄清楚您所关心的偏离正常状态的种类(例如偏度),以及该偏差在困扰您之前必须达到的程度。然后,您可以进行测试以查看数据中与完美正态性的偏差是否小于临界值。有关一般想法的更多信息,这可能有助于在这里阅读我的答案:为什么统计学家说不重要的结果意味着“您不能拒绝零”而不是接受零假设?


5

我想计算一个p值,以在显着性水平αiff p <α时拒绝H0;证明我的人口呈正态分布。

当数据由一系列附加的iid事件生成时,将出现正态分布(请参见下面的梅花形图像)。这意味着没有反馈,也没有相关性,听起来像是引导数据的过程吗?如果没有,那可能不正常。

在您的情况下,很可能会发生某种类型的过程。最接近“证明”的地方是收集足够的数据以排除人们可以想到的任何其他分布(这可能是不实际的)。另一种方法是从某些理论和其他预测推论出正态分布。如果数据与所有数据都一致,并且没人能想到另一种解释,那么这将是支持正态分布的良好证据。

https://upload.wikimedia.org/wikipedia/commons/7/7f/Quincunx_%28Galton_Box%29_-_Galton_1889_diagram.png https://en.wikipedia.org/wiki/Bean_machine

现在,如果您不期望任何特定的分布,可以使用正态分布来汇总数据仍然是合理的,但是请注意,这本质上是出于无知的选择(https://en.wikipedia.org/wiki/ Principle_of_maximum_entropy)。在这种情况下,您不想知道总体是否为正态分布,而是想知道对于下一步将要满足的情况,正态分布是否是合理的近似值。

在这种情况下,您应该提供您的数据(或类似的生成数据)以及您打算如何处理的描述,然后问“在这种情况下假设正常性会以什么方式误导我?”


我实际上知道数据是正常的(在独立计算机上进行独立测量),但是我需要为我的论文做一些假设。.谢谢您的澄清和举例:)
petrbel

1
顺便提一句,克里格(Krieger)对位于北克里格(N. Krieger)的高尔顿(Galton)的Quincunx(2012)的使用提出了很好的批评。谁是什么“人口”?历史辩论,当前争议以及对理解“人口健康”和纠正健康不平等的影响。《米尔班克季刊》,90(4):634–681。
亚历克西斯

@petrbel这种情况与上述情况有些微妙。您可以设计一个梅花形体,其中每个观测值都是同义的,但生成数据的过程却不是。请参阅此处以获取对数正态示例:LIMPERT等。跨科学的对数正态分布:键和线索。2001年5月/卷 51 No. 5.生物科学。
Livid 2015年

1
@Alexis我看到Krieger(2012)复制了Limpert等人的图。(2001年),并指出了彼得贝尔遗漏的观点:“改变结构可以改变结果概率,即使对于相同的对象,也可以创建不同的人口分布”。
Livid 2015年

2

您将永远无法在数据中“证明”正态性假设。仅提供针对它的证据作为假设。Shapiro-Wilk检验是执行此操作的一种方法,并且一直用于证明正态性假设是正确的。原因是您从假设正态性开始。然后您问,我的数据是否表明我在做一个愚蠢的假设?因此,您可以继续使用Shapiro-Wilk进行测试。如果您未能拒绝原假设,那么数据并不表明您在做一个愚蠢的假设。

Y,X


您描述的这种做法恰恰是petrbel提到的错误方法。测试通常是一致的,因此样本量越大,宣布正态性假设是愚蠢的主意的可能性就越大。这本身很愚蠢,因为对于大样本量,由于大多数过程的渐近鲁棒性,正态性假设的要求不太严格。
HorstGrünbusch2015年

@HorstGrünbusch您是否不同意Shapiro-Wilk检验是检验数据假设为Normal的有效方法?
TrynnaDoStat 2015年

如果您同意这是一种有效的方法,那么我不确定您在我的回答中有何不同。
TrynnaDoStat

2α

@HorstGrünbusch看来您回答我的问题与总体上假设检验的想法有关。具体而言,在许多情况下,假设检验会随着样本量接近无穷大而以概率1拒绝零值。
TrynnaDoStat 2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.