零假设是哪一个?科学理论,逻辑学和统计学之间的冲突?


20

我很难理解设定原假设的基本逻辑。在这个答案中,显然公认的命题被陈述为:零假设是不会有影响的假设,一切都会保持不变,也就是说,在阳光下没有新事物。

然后,另一种假设就是您试图证明的假设,例如,一种新药兑现了诺言。

现在从科学理论和一般逻辑学来的我们知道,我们只能伪造命题,我们无法证明某些东西(没有数量的白色天鹅可以证明所有天鹅都是白色的,但是一只黑天鹅可以证明它)。这就是为什么我们试图证明原假设的原因,这不等于证明替代假设-这就是我开始怀疑的地方-我将举一个简单的例子:

假设我想找出窗帘后面是哪种动物。不幸的是,我无法直接观察到该动物,但是我进行了一项测试,该测试使我知道了该动物的腿数。现在,我有以下逻辑推理:

如果动物是狗,那么它将有4条腿。

如果我进行测试并发现它有4条腿,则不能证明它是狗(可以是马,犀牛或任何其他4条腿的动物)。但是,如果我发现它没有四只脚,则可以肯定地证明它不能是狗(假设是健康的动物)。

转化为药物有效性,我想了解幕后药物是否有效。我唯一会得到的数字就是给我效果的数字。如果效果是肯定的,则没有任何证据(4条腿)。如果没有效果,我就证明该药的有效性。

我认为所有这些都与常识相反,唯一有效的零假设必须是

该药物有效(即:如果该药物有效,您将看到效果)。

因为这是我唯一可以反驳的事情-直到下一轮我会尝试更加具体,依此类推。因此,是由零假设来说明影响,而替代假设则是默认假设(无影响)。

为什么统计检验似乎使它倒退?

PS:你甚至不能否定上述假设得到有效等价假说,所以你不能说“的药物是不是有效”的零假设,因为只有逻辑上等同的形式是“如果你看到没有效果的药物会不会是有效”一词,却无济于事,因为现在得出的结论就是您想要找到的!

PPS:只是为了阅读到目前为止的答案,以供澄清:如果您接受科学理论,则只能伪造陈述而不能证明它们,唯一在逻辑上一致的是选择零假设作为新理论-然后可以伪造的。因为如果您伪造现状,您将一无所获(现状被反驳,但新理论远未得到证明!)。而且,如果您不能伪造它,那么您也不会处于更好的位置。


3
提示:“该药物有效”尚未被充分量化为科学或统计陈述。 您将如何使其量化?
ub

1
@whuber:这是我遇到的最少的问题:只需说,例如血液压力降低10%。我认为这一定是原假设-替代假设是“什么都没有发生”。
vonjd 2011年

9
相反,这是问题的症结所在。统计信息中最好设置一个表示效果为-10%的null。如果实验产生的证据足够相反,则您可以拒绝它。但是请注意,除非有特殊的计算和概念上的欺骗,否则每个实验只能测试一个这样的假设。还要注意的是,这是很少见的实验人员,他非常清楚地知道效果的大小(但是仍然需要进行测试!)。

3
好吧,在药物试验的实践中,无效通常被解释为“该药物不比当前治疗更有效”,而替代方案是“该药物比当前治疗更有效”。顺便说一句,它具有内置的效果大小。有了这个配方,证据对于该药物的疗效可以拒绝空。交换假设后,功效的证据只会阻止人们拒绝该药物是好的说法。在第一种情况下,举证责任要严格得多。
ub

1
@vonjd:您说,“如果您伪造现状,您将一无所获”。错误。如果我们对“狗” /“不是狗”进行定性判断,那么提供“不是狗”的证据并不是针对“狗”的特别有力的证据。但是,这就是量化事物的价值。如果我提供“非0”的证据,则表明该值不是0,这为它提供了很好的证据。如果您担心提供的是好是坏的证据均等,请使用单尾检验。
russellpierce

Answers:


12

在统计数据中,有等效性检验和更常见的检验Null并确定是否有足够的证据反对它。等效性检验使这一切反过来了,并认为效果与Null不同,我们确定是否有足够的证据反对Null。

我不清楚你的毒品例子。如果响应是效果的值/指标,则效果0表示无效。可以将其设置为Null并据此评估证据。如果影响充分不同于零,我们将得出结论,即无效假设与数据不一致。两尾检验可以将效应的足够负值视为反对Null的证据。一个单尾测试,效果是积极的,并且与零完全不同,这可能是一个更有趣的测试。

如果要测试效果是否为0,那么我们需要将其翻转,并使用等效测试,其中H0是效果不等于零,或者是H1 =效果= 0。会根据效果不为0的想法来评估证据。


9
这里的部分问题是,IIRC,我们选择无效果作为Null的原因是因为该效果的参数是0。如果要解决这个问题,并产生一些非零的Null值,那么我们需要预先知道此参数对整个总体的值,以及是否知道该参数对于Null的值。人口将没有意义的测试。
恢复莫妮卡-G.辛普森

好吧,对于替代假设,我们似乎也会遇到同样的问题(我们也不知道那里的参数)。所以我的问题是:为什么不同时交换两者?这在逻辑上似乎更加一致。
vonjd 2011年

我让其他人对等效测试发表评论。它们与在标准测试中交换假设并不相同,但是我对那些想法并不熟悉。我认为对等测试遭受我在评论中提到的问题的困扰,这是不正确的。它们是从非常不同的理论角度提出的。
恢复莫妮卡-G.辛普森

5

我认为这是另一种情况,常客统计不能直接回答您实际要提出的问题,因此回答了(不是这样)细微不同的问题,很容易将其误解为对问题的直接回答。您实际上想问的问题。

通常,我们真正想问的是,替代假设为真的概率是多少(或者比零假设更可能为真)。但是,从频率论者的分析根本无法回答这个问题,因为对于一个频率论者来说,概率是一个长期的频率,在这种情况下,我们对特定假设的真实性很感兴趣,该假设没有长期的频率-是或不是。另一方面,贝叶斯可以直接回答这个问题,因为贝叶斯概率是某种命题合理性的量度,因此在贝叶斯分析中为特定假设的真相分配概率是完全合理的。

常客对特定事件的处理方式是将其视为来自某些(可能是虚构的)人口的样本,并对该人口做出陈述,而不是对特定样本的陈述。例如,如果您想知道特定硬币有偏斜的可能性,则在观察N次翻转并观察H头和尾巴后,经常性分析无法回答该问题,但是它们可以告诉您硬币分布的比例无偏的硬币,在翻转N次后会产生h或更多的头。由于我们在日常生活中使用的概率的自然定义通常是贝叶斯的而不是常客的,因此将其视为零假设(硬币是无偏的)是真实的可能性就太容易了。

本质上,频繁主义者的假设检验在其核心中潜藏着一个隐含的主观主义者贝叶斯成分。频繁检验可以告诉您在原假设下观察统计数据的可能性至少为极端,但是基于这些理由拒绝原假设的决定完全是主观的,因此您没有合理的要求。本质经验表明,如果p值足够小(同样,阈值是主观的),我们通常会在合理的基础上拒绝零值,这就是传统。AFAICS不太适合科学的哲学或理论,它本质上是一种启发式方法。

尽管这并不意味着它不是一件坏事,尽管它的缺陷在于常识性假设检验提供了我们研究必须克服的障碍,这有助于我们作为科学家保持自我怀疑,而不会对理论抱有热情。因此,尽管我本质上是贝叶斯主义者,但我仍会定期使用常客假设检验(至少直到期刊审稿人对贝叶斯汀替代品感到满意为止)。


3

除了加文的答案,还有两件事:

首先,我听过这样的想法,即主张只能被伪造,而不能被证明。您能否张贴一个讨论的链接,因为用我们这里的措词似乎并不能很好地支持-如果X是一个命题,那么not(X)也是一个命题。如果可以证明命题,那么证明X与证明not(X)相同,我们已经证明了一个命题。

test+

该药物有效(即:如果该药物有效,您将看到效果)。

test+test+H0

test+H0test+H0

因此,狗案件与有效性案件之间的区别在于从证据到结论的推论是否适当。在狗的情况下,您已经观察到一些证据并不强烈暗示狗。但是在临床试验中,您已经观察到了一些确实暗示疗效的证据。


1
谢谢。如果您接受只能伪造陈述而不能证明它们(在一秒钟内链接),那么唯一在逻辑上一致的就是选择零假设作为新理论-然后可以对其进行伪造。如果您伪造现状,您将一无所获(现状被反驳,但新理论还远未得到证明!)。现在,对于链接,我认为一个不错的起点是:en.wikipedia.org/wiki/Falsifiability
vonjd 2011年

2
我想在此提及的一点是,您不是在证明或反驳原假设。您所做的决定(通常)是保留还是拒绝原假设。当您拒绝原假设时,您并没有反驳它。您所做的只是说,鉴于观察到的数据,原假设不大可能。
russellpierce

@drknexus:好吧,您不同意逻辑上证伪的概率吗?
vonjd 2011年

4
@drknexus不说“给定观察到的数据,原假设是不可能的”,而是“如果原假设是真实的,那么这个数据是不可能的”,这会更准确吗?难道在统计假设检验中将这两个经典错误混为一谈吗?
Michael McGowan

1
MM:你是对的。我的措辞马虎。
russellpierce

3

从某种意义上说,常识性假设检验使它倒退是正确的。我并不是说这种方法是错误的,而是结果通常并非旨在回答研究人员最感兴趣的问题。如果您想要一种更类似于科学方法的技术,请尝试贝叶斯推理

用贝叶斯推断,而不是谈论可以拒绝或不能拒绝的“零假设”,您可以基于对当前情况的了解,从先验概率分布开始。当您获得新的证据时,贝叶斯推理为您提供了一个框架,可以在考虑到证据的情况下更新您的信念。我认为这与科学的运作方式更加相似。


3

我认为您在这里有一个基本错误(并不是说假设检验的整个领域都清楚了!),但是您说替代方法是我们尝试证明的方法。但这是不对的。我们试图拒绝(伪造)null。如果如果null为真,我们获得的结果不太可能,则我们拒绝null。

现在,就像其他人所说的,这通常不是我们要问的问题:我们通常不关心如果null为真的结果有多大可能,我们并不关心给定结果是否为null。



2

我将在@Doc上进一步提及Paul Meehl:

1)测试您的研究假设的反面,因为原假设使它成立,因此您只能确认其结果是“形式上无效”的论点。结论不一定从前提得出。

If Bill Gates owns Fort Knox, then he is rich.
Bill Gates is rich.
Therefore, Bill Gates owns Fort Knox.

http://rationalwiki.org/wiki/Affirming_the_consequent

如果理论是“这种药物将改善恢复”,而您观察到恢复提高,则并不意味着您可以说您的理论是正确的。出于某些其他原因,可能会出现恢复提高的情况。没有两组患者或动物在基线时会完全相同,并且在研究过程中会随着时间的推移而发生进一步的变化。对于观察性研究,这是比实验研究更大的问题,因为随机化可以“防御”基线时未知混杂因素的严重失衡。但是,随机化并不能真正解决问题。如果不清楚这些混杂因素,我们将无从谈起“随机防御”取得成功的程度。

另请参见表14.1和为何无法独自检验理论的讨论(总是伴随着辅助因素):

保罗·米尔(Paul Meehl)。LL Harlow,SA Mulaik和JH Steiger(编辑)的“问题是认识论的问题,不是统计问题:用置信区间替换显着性检验并量化风险数字预测的准确性”,如果没有显着性检验怎么办?(第393-425页)新泽西州马瓦市:厄尔鲍姆,1997年。

2)如果引入某种类型的偏见(例如,某些混杂因素的失衡),我们将不知道该偏见将位于哪个方向或强度如何。我们可以给出的最佳猜测是,有50%的机会使治疗组偏向更高的康复方向。随着样本量的增加,重要性检验也将有50%的机会检测到这种差异,并且您将数据解释为证实了您的理论。

这种情况与“该药物将使恢复率提高x%”的原假设完全不同。在这种情况下,存在任何偏见(我会说在比较动物和人类时总是存在这种偏见)使您更有可能拒绝您的理论。

考虑可能的结果的“空间”(Meehl称其为“ Spielraum”),以可能的最极端测量为边界。可能会有0-100%的恢复,而您可以以1%的分辨率进行测量。在通用意义测试案例中,与您的理论相符的空间将是您可以观察到的可能结果的99%。在您预测特定差异的情况下,与您的理论相符的空间将是可能结果的1%。

换句话说,寻找针对均值1 =均值2无效假设的证据,并不是对某种药物在起作用的研究假设的严格检验。平均值1 <平均值2的空值更好,但仍然不是很好。

参见图3和图4:(1990)。评估和修正理论:拉卡托斯人的防御策略和两个需要使用的原则。心理咨询,1,108-141,173-180


0

并非所有统计数据都以自然世界(与游戏和游戏的人造世界不同)中没有确定的假设为前提。换句话说,我们接近理解它的唯一方法是测量一件事物与另一件事物相关的概率,该概率在0到1之间变化,但是如果我们可以在一个物体中无限次地检验假设,则只能为1。无限数量的不同情况,这当然是不可能的。由于相同的原因,我们永远无法知道它为零。这是一种比自然数学更可靠的方法,它可以理解自然的现实,​​而数学是处理绝对值并且主要依赖于方程的,我们知道这是理想的,因为如果从字面上看,方程的LH侧确实等于RH侧,则这两个侧可能会被扭转,我们将一无所获。严格来说,它仅适用于静态世界,不适用于本质上动荡的“自然”世界。因此,原假设甚至应被用于数学-只要它被用来理解自然本身。


0

我认为问题在于“真实”一词。自然世界的现实本质上是不可知的,因为随着时间的推移,它的无限复杂和无限变化,因此应用于自然的“真相”始终是有条件的。我们所能做的就是通过重复实验来找出变量之间可能对应的水平。在试图理解现实的过程中,我们在心中寻找看似有序的事物,并在我们的脑海中构建概念上有意识的模型,以帮助我们做出明智的决定,但是这在很多情况下都是命中注定的事情,因为总是存在意外。零假设是我们试图理解现实的唯一可靠起点。


1
我认为您应该合并两个答案。
vonjd

-1

我们必须选择零假设,即我们要拒绝的假设。

因为在我们的假设检验场景中,存在一个关键区域,如果假设下的区域位于关键区域内,我们将拒绝该假设,否则我们将接受该假设。

因此,假设我们选择零假设,即我们要接受的假设。而且原假设下的区域不属于关键区域,因此我们接受原假设。但是这里的问题是,如果原假设下的区域在可接受区域之下,那么这并不意味着替代假设下的区域将不在可接受区域之下。如果是这种情况,那么我们对结果的解释将是错误的。因此,我们只能将该假设作为我们要拒绝的无效假设。如果我们能够拒绝原假设,则意味着替代假设为真。但是,如果我们不能拒绝零假设,那么这意味着两个假设中的任何一个都是正确的。也许我们可以再进行一次检验,在该检验中我们可以将替代假设作为零假设,然后我们可以尝试拒绝它。如果我们能够拒绝替代假设(现在是零假设),那么我们可以说我们最初的零假设是正确的。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.