是否有可能证明原假设？

37

正如问题所指出-是否有可能证明原假设？根据我对假设的（有限的）理解，答案是否定的，但我无法对此提出严格的解释。问题是否有明确的答案？

hypothesis-testing proof equivalence

— Pulkit Sinha
source

4

这取决于您所说的“证明”。如前所述，这是一个哲学问题，而不是统计问题，也没有明确的答案（尽管至少从大卫·休ume时代以来，大多数人都会回答“否”）。

— whuber

这有点不合时宜。我们需要知道发生这种“证明”的条件。

— 概率

也许提出得更好的问题是“在什么条件/假设下可以证明原假设？”

— 概率

相关：为什么统计学家说不重要的结果意味着“您不能拒绝零”而不是接受零假设？

— 变形虫说莫妮卡（Monica）恢复

19

如果您是在谈论现实世界而不是形式逻辑，那么答案当然是。通过经验手段对任何事物的“证明”取决于人们可以做出的推理的强度，而推理的强度又由测试过程的有效性决定，该测试过程是根据人们对世界运作方式的一切了解（即理论）而评估的。每当有人接受某些经验结果证明拒绝“零”假设是正当的时候，就必须做出这种判断（设计的有效性；世界以某种方式起作用），因此必须做出必要的类似假设，以证明推断“对……的证明”。 null” 不是问题。

那么类似的假设是什么？这是健康科学和社会科学中常见的“证明无效”的例子。（1）以某种实际上有意义的方式定义“无效”或“无效”。假设我相信自己应该表现得好象一种疾病的两种治疗方法t1和t2之间没有有意义的区别，除非一种方法比另一种方法具有更好的3％的恢复机会。（2）找出有效的设计来测试是否有任何影响-在这种情况下，t1和t2之间的恢复可能性是否存在差异。（3）进行功效分析，以确定是否需要多少样本量才能产生足够高的可能性-在给定的条件下，我有信心依靠该样本量假设它存在。通常人们说，如果在指定的alpha值下观察到指定效果的可能性至少为0.80，那么力量就足够了，但是正确的置信度实际上是您对错误的厌恶程度的问题-与选择p时的情况相同值阈值以“拒绝null”。（4）进行经验测试并观察效果。如果它低于指定的“有意义的差异”值（在我的示例中为3％），则表明您“证明”没有任何效果。

有关此问题的好方法，请参见Streiner，《 DL Unicorns确实存在：关于“证明”零假设的教程》。加拿大精神病学杂志48，756-761（2003）。

— dmk38
source

1

+1。这是清楚了解“证明”标准重要性的一个很好的例子。在许多应用程序中，您在此处调用的一个标准（即我可能会称呼它为“行为标准”）实在太弱了，没有人会接受它作为“证明”。但是，我不否认其效用，并主张采用这种方法来支持理性决策。（但也许贝叶斯方法更好... :-)

— 麻烦

1

（+1）个好答案。我添加了Streiner文章在线版本的链接；希望您不要介意（随时删除）。

— chl

1

还有两件事：（1）对于Streiner来说，将未能拒绝null的失败作为支持 null的证据是令人震惊的常见错误和常见情况。这个错误实质上将对“ p <0.05”范式中类型1错误的强烈厌恶转变为制造类型2的许可。S说，“等等-您需要力量...”（2）Whuber引用了休ume的著名论点。H公司的PT实际上只是颠覆性的经验证据拒绝null作为证据的的空。H说归纳法不支持因果推理。好; 但是实证研究别无选择！因果关系，请去Pearl（＆Bayes），而不是Hume！

— dmk38 2011年

1

有关等效性测试的问题也有一些不错的建议stats.stackexchange.com/questions/3038/…–

— Jeromy Anglim

这是否等于假设“非零”作为新的零假设，然后拒绝了这个新的零假设？

16

从数学的角度上回答：只有且仅当“假设彼此相同”时才有可能。

$H_0$ 且犯错的可能性为零，那么您正在搜索的是所谓的“理想测试”，存在：

$X$ $P_0$ $P_1$ $H_0: X\leadsto P_0$ $H_1: X\leadsto P_1$ $P_1\bot P_0$ $P_1$ $P_0$

如果您不知道“互异”是什么意思，我可以举个例子：和（和）相互单数。这意味着如果您要测试 $\mathcal{U}[0,1]$ $\mathcal{U}[3,4]$ $[0,1]$ $[3,4]$

$H_0: X\leadsto \mathcal{U}[0,1]$ 与 $H_1: X\leadsto \mathcal{U}[3,4]$

然后就存在一个理想的测试（猜出它是什么：））：一个永远不会出错的测试！

如果和不互为奇数，则该不存在（这是由于“仅在部分中存在”）！ $P_1$ $P_0$

用非数学术语来说，这意味着您可以并且仅当在假设中已经存在证明时才可以证明为空（即并且当并且仅当您选择了假设和如此不同以至于无法识别来自的单个观察值时）作为一个，反之亦然）。 $H_0$ $H_1$ $H_0$ $H_1$

— 罗宾·吉拉德
source

4

+1好答案。数学的一个简单表示是，假定null及其替代品产生不相交的结果集。例如，这个房间里有没有斑马，或者没有。当然，“证明”在这里暗含“基于模型的条件”，它本身从来没有像数学定理那样严格地建立过。它隐含地包括“以观察的准确性为条件；” 它隐含地包括对假设的明确解释。（对于后者的批评，请参见乔治·拉科夫的《女人，火和危险的事物》。）

— 胡言乱语

11

是的，有一个明确的答案。答案是：不，没有办法证明原假设。据我所知，您能做的最好的事情就是在您的估计数周围置信区间，并证明影响是如此之小，以至于可能根本不存在。

— 拉塞尔皮尔斯
source

4

一般而言，统计中的问题不是您无法证明原假设，而是您无法确定任何点估计。也就是说，就像您不能说“变量没有作用”一样，您也不能说“变量的作用大小为1.95”。统计数据始终具有置信区间。

— russellpierce

1

同意答案是很大的“否”，原因很明确：建立统计假设。接受的答案另有要求的事实绝对是可悲的。假设检验提供的答案是：假设我的假设是正确的，那么我采样的数据是否与之一致？而且绝不是相反的方式。不需要太多的理由就能理解，您不能从该假设中得出假设是否正确。

— Christophe

4

对我而言，决策理论框架提供了理解“零假设”的最简单方法。它基本上说必须至少有两个选择：零假设和至少一个选择。然后，“决策问题”是接受其中一种选择，而拒绝其他选择（尽管我们需要精确地理解“接受”和“拒绝”假设的含义）。我看到一个问题：“我们可以证明原假设吗？” 类似于“我们总是可以做出正确的决定吗？”。从决策理论的角度来看，如果

1）决策过程中没有不确定性，因为这是一项数学练习，以确定正确的决策是什么。

2）我们接受问题的所有其他前提/假设。最关键的一个（我认为）是我们正在决定的假设是详尽无遗的，其中一个（只有一个）必须是正确的，而另一个则必须是错误的。

从更哲学的角度来看，从“证明”完全取决于导致该“证明”的假设/公理的意义上说，“证明”是不可能的。我认为证明是一种逻辑上的对等，而不是“事实”或“真相”，在某种意义上，如果证明是错误的，那么导致证明的假设也是错误的。

将其应用于“证明原假设”，只要简单地假设其为真，或者如果满足某些条件（例如统计值），就可以“证明”它为真。

— 概率逻辑
source

3

是的，有可能证明空值-在完全相同的意义上，有可能证明空值的任何替代方法。在贝叶斯分析中，完全支持零值的可能性与任何建议的替代值的可能性都非常大。此外，如上述某些答案所断言的那样，断言只有在其替代方案不相交（不与空值重叠）的情况下才可以证明空值是错误的。在贝叶斯分析中，每个假设都具有先验概率分布。这种分布将单位质量的先验概率分布在建议的替代方案上。零假设将所有先验概率置于一个备选方案上。原则上，对null的替代可能会将所有先验概率置于某个非null替代上（在另一个“点”上），但这很少见。一般而言，替代套期保值，即，它们将相同的先验概率散布在其他替代方案上-排除了无效替代方案，或更常见的是，包括了无效替代方案。问题就变成了哪个假设将实验数据实际落在最先验概率上。如果数据紧紧围绕零值表示应该落入的位置，那么即使将其包括在内（嵌套在其中，但并非唯一），也将是优势（在建议的假设中）。人们认为，嵌套的替代方案不可能比嵌套的替代方案更有可能反映出无法区分概率和可能性。尽管不可能有一个集合的某个部分比整个集合具有更低的概率，但完全有可能使一个假设集合的一个部分的后验可能性大于整个集合的后验可能性。假设的后验似然性是假设函数所假设的似然函数与先验概率分布的乘积。如果假设将所有先验概率放在正确的位置（例如，为零），则与将某些先验概率放置在错误的位置（而不是为零）的假设相比，后验概率更高。假设的后验似然性是假设函数所假设的似然函数与先验概率分布的乘积。如果假设将所有先验概率放在正确的位置（例如，为零），则与将某些先验概率放置在错误的位置（而不是为零）的假设相比，后验概率更高。假设的后验似然性是假设函数所假设的似然函数与先验概率分布的乘积。如果假设将所有先验概率放在正确的位置（例如，为零），则与将某些先验概率放置在错误的位置（而不是为零）的假设相比，后验概率更高。

2

从技术上讲，不，无效假设无法得到证明。对于任何固定的，有限的样本量，总会有一些很小但非零的影响量，您的统计检验几乎没有任何作用。不过，实际上，您可以证明您处于零假设的某个小ε范围内，因此，小于此ε的偏差实际上并不重要。

— dsimcha
source

2

在某些情况下，可以提供证明。假设您有一所学校，而您的零假设是男孩和女孩的数量相等。随着样本量的增加，男孩和女孩的比例中的不确定性趋于减少，最终在对整个学生群体进行抽样时达到确定性（这就是我假设您要证明的意思）。

但是，如果您没有有限的总体，或者您要进行替换抽样并且不能发现重采样的个体，那么您就不能将有限样本的不确定性降低到零。

— 亨利
source

0

我想在这里讨论一点，很多用户有些困惑。空假设假设H0：p = 0的真正含义是什么？我们是否要确定参数p是否为零？当然不是，没有办法实现这一目标。

我们打算建立的是，在给定数据集的情况下，评估的参数值从零开始是（或不是）不可分辨的。请记住，NHST对替代假设是“不公平的”：零值归因于95％的置信度，而只有5％的替代率。因此，“不重要”的结果并不意味着H0成立，而是简单的说，我们没有找到足够的证据证明替代方案是可能的。

— 利卡斯
source