如何在假设检验中指定原假设

15

如何为原假设选择问题的最佳经验法则是什么。例如，如果我要检查假设B是否为真，我应该使用B作为零值，使用B作为替代假设，还是将NOT B用作零值？我希望问题清楚。我知道这与我要最小化的错误（类型I？）有关，但我一直忘了它的发展，因为我没有为它建立清晰的直觉。谢谢。

hypothesis-testing

— 内斯特
source

伙计们...很好的回应。所有有帮助。当我在网上获得这种级别的协作时，仍然感到惊讶，因为人们对此很感兴趣。哇谢谢！

— Nestor

17

我的一位优秀顾问的经验法则是将零假设设置为您不想成为真实结果的结果，即您想要显示正相反的结果。

基本示例：假设您已经开发了一种新的治疗方法，并且想证明它确实比安慰剂好。因此，您应将Null-Hypothesis 设置为等于或比安慰剂更差，而Alternative Hypothesis 新疗法要比安慰剂更好。 $H_0:=$ $H_1:=$

这是因为在进行统计检验的过程中，您要么拒绝了零假设（并支持替代假设），要么您无法拒绝它。由于您的“目标”是拒绝零假设，因此将其设置为您不想成为真实结果的结果。

旁注：我知道，在否定假设被拒绝之前，不应该建立统计检验来扭曲并破坏它，随意语言只是用来使该规则更容易记住。

这也可能会有所帮助：统计检验中p值和t值的含义是什么？和/或什么是对计算机科学家进行统计假设检验的良好介绍？

— 斯蒂芬
source

6

如果假设B是有趣的假设，则可以将not-B用作无效假设，并在无效条件下控制在级别处错误拒绝not-B的类型I错误的概率。由于我们控制了I型错误，因此拒绝not-B会被解释为支持B的证据，因此not-B不太可能为真。困惑...？ $\alpha$

以某人群中两组的治疗与不治疗为例。有趣的假设是治疗具有效果，即由于治疗，治疗组和未治疗组之间存在差异。零假设是没有差异，我们控制错误拒绝该假设的可能性。因此，当没有治疗效果时，我们控制错误地推断出有治疗效果的可能性。II型错误是当存在治疗效果时错误接受null的可能性。

上面的表述基于用于统计测试的Neyman-Pearson框架，在该框架中，统计测试被视为案例，无效案例和替代案例之间的决策问题。如果我们（独立）重复测试，则级别是我们犯I型错误的次数的分数。在此框架中，null和替代之间确实没有任何形式上的区别。如果我们将null和替代项互换，我们将互换I型和II型错误的概率。但是，我们没有将II型错误的概率控制在上述范围内（这取决于治疗效果的大小），并且由于这种不对称性，我们可能更愿意说我们未能拒绝 $\alpha$ 原假设（而不是我们接受原假设）。因此，我们应该谨慎地断定原假设是正确的，只是因为我们不能拒绝它。

在Fisherian 重要性检验框架中，实际上只有一个零假设，并且在零假设下计算观察到的数据的值。较小的被解释为针对null的更有力证据。在这里，零假设绝对不是B（治疗无效），值被解释为针对零的证据。通过较小的值，我们可以放心地拒绝无效值，即没有治疗效果，并得出有治疗效果的结论。在这个框架中，我们只能拒绝或不拒绝（永远不接受）空值，而这全都是伪造空值。注意 $p$ $p$ $p$ $p$ $p$ -值不需要通过重复的（假想的）决策来证明。

这两个框架都不是没有问题的，并且术语经常混淆。我可以推荐《统计证据：理查德·M·罗亚尔（Richard M. Royall）的可能性范式》一书，以明确处理不同的概念。

— NRH
source

5

“常客”的反应是发明形式为“非B”的零假设，然后与斯特芬的反应一样反对“非B”。这在逻辑上等同于使参数“您错了，因此我必须是对的”。这就是政治家使用推理的方式（即对方不好，因此我们很好）。用这种推理很难处理一种以上的选择。这是因为“你们错了，所以我是对的”的论点仅在不可能两者都错的情况下才有意义，而当存在多个备选假设时，这肯定会发生。

“贝叶斯”响应只是根据您拥有的任何证据，简单地计算您对检验感兴趣的假设的概率。总是包含先验信息，这只是您为使问题正确提出而做出的假设（所有统计过程都依赖于先验信息，贝叶斯方法只是使它们更加明确）。它通常也包含一些数据，我们有贝叶斯定理

P (H_{0} | D I) = \frac{P (H_{0} | I) P (D | H_{0} I)}{\sum_{k} P (H_{k} | I) P (D | H_{k} I)}

$P(H_{0}|DI)=\frac{P(H_{0}|I)P(D|H_{0}I)}{\sum_{k}P(H_{k}|I)P(D|H_{k}I)}$

这种形式独立于所谓的“零”和所谓的“替代”，因为您必须为要考虑的每个假设（先验概率和可能性）计算完全相同的数量。从某种意义上讲，这类似于在Neyman Pearson假设检验中计算“类型1”和“类型2”的错误率，只是因为当为“空” 时的“类型2”的错误率与用“1型”错误率 $H_0$ $H_0$ 是“替代”。只有单词“ null”和“ alternative”所隐含的含义使它们看起来有所不同。当存在两个假设时，可以在“ Neyman Pearson Lemma”的情况下显示等价关系，因为这只是似然比，它是通过考虑上述贝叶斯定理的几率而立即给出的：

\frac{P (H_{0} | D I)}{P (H_{1} | D I)} = \frac{P (H_{0} | I)}{P (H_{1} | I)} \times \frac{P (D | H_{0} I)}{P (D | H_{1} I)} = \frac{P (H_{0} | I)}{P (H_{1} | I)} \times Λ

$\frac{P(H_{0}|DI)}{P(H_{1}|DI)}=\frac{P(H_{0}|I)}{P(H_{1}|I)}\times\frac{P(D|H_{0}I)}{P(D|H_{1}I)}=\frac{P(H_{0}|I)}{P(H_{1}|I)}\times\Lambda$

因此，决策问题是相同的：接受时一些截止，并接受，否则。因此，这些程序基本上是选择截止值或决策边界的不同原理。“贝叶斯”将说它应该是先前赔率乘以损失率的乘积 $H_0$ $\Lambda > \tilde{\Lambda}$ $\tilde{\Lambda}$ $H_1$ $\frac{L_2}{L_1}$ $L_1$ $L_2$

$\Lambda^{-1}<\tilde{\Lambda}^{-1}$

— 概率逻辑
source

3

第一段是对假设检验的经典方法的模仿。

— ub

假设检验并不总是要做出决定的问题。它通常是这样写的，但在科学上，问题可能是要记录null是否为假以及错误的数量。我认为文字游戏是对这一目标的提醒。从这个角度来看，拒绝失败不是接受决定，而是数据中缺乏拒绝证据。

— NRH

@NRH-我同意，但这并不总是目标。如果您想检验一种新理论，则想知道它是正确的可能性，也想知道它是错误的可能性。而且，尽管假设检验并不总是直接导致决策，但是如果检验最终不会导致决策，那似乎是在浪费时间来进行检验。实际上，您已经在评论中制定了一个决定：“就像null为false一样行动”。对此，只有一种选择：“就像null为true一样行动”。如果有不止一种选择，那么该假设...

— 概率

（续）..测试的定义不明确，可以说是“数学上不适当的”。这项决定可能存在很大的不确定性，但是没有其他选择，除非您有不适的/模棱两可的问题，否则null不能同时为true和not false。但是在这种情况下，假设检验是没有意义的-没有正确的结论。

— 概率

（续）-如果目标是简单地针对零值对证据进行量化，则您不需要假设检验。这就是p值的用途-您无需接受或拒绝，只需报告其值即可。

— 概率

1

零假设通常应假定响应变量中的差异仅是由于错误造成的。

例如，如果要测试某些因素A对response的影响x，则null为： $H_0$ = A对响应没有影响x。

未能拒绝该零假设的情况将被解释为：

1）任何差异x仅归因于错误而不是归因于A，

2）即使存在一个数据也不足以检测差异（请参见下面的2类错误）。

拒绝该原假设将被解释为替代假设： $H_a$ = A对response 有影响x，为true。

类型1和类型2错误与原假设的使用有关，但实际上与它的指定无关。当您拒绝时，会发生类型1错误 $H_0$ 即使这是真的-也就是说，您错误地得出结论：A对x不存在时的影响。当您无法拒绝 $H_0$ 即使它是假的-也就是说，你不正确的结论没有影响A的x，即使一个存在。

— DQdlM
source

1

第三段似乎暗示着不拒绝null意味着null为true，但是显然这是错误的：替代方案可以为true（通常是），但与给定数据无法检测到的null没有太大区别。

— ub

@whuber-好点，我将编辑答案以反映这一点

— DQdlM 2011年