为什么原假设经常被拒绝?


35

希望标题有意义。通常,原假设是为了拒绝它而形成的。这是有原因的,还是只是一个约定?




Answers:


26

统计假设检验的目的主要是施加自我怀疑,除非有合理的证据支持,否则我们在发布假设时要谨慎。因此,在通常的假设检验形式中,原假设提供了一个“魔鬼拥护者”,反对我们,并且只有在我们能够证明观察结果表明拥护者的论证不太可能是正确的情况下,才公布我们的假设。所以我们取H0做我们不想做的事情,然后看看我们是否能够拒绝它。如果我们可以拒绝它,那并不意味着我们的假设可能是正确的,只是它已经克服了这一基本障碍,因此值得考虑。如果我们做不到,那并不意味着我们的假设是错误的,可能就是我们没有足够的数据来提供足够的证据。正如@Bahgat正确建议的(+1),这很大程度上是Popper证伪主义的想法。

但是,可以进行一个测试,其中是您想要为真的事物,但是为了使该函数起作用,您需要证明该测试具有足够高的统计能力,才能确信拒绝空值。如果它实际上是错误的。计算统计能力比执行测试更加困难,这就是为什么很少使用这种形式的测试,而通常使用H 0是您不希望为真的替代方法的原因。H0H0

因此,您不必采用来反对您的假设,但这确实使测试过程更加容易。H0


21

卡尔·波普尔Karl Popper)说:“ 我们不能最终肯定一个假设,但是我们可以最终否定它 ”。因此,当我们在统计数据中进行假设检验时,我们试图否定(拒绝)我们感兴趣(不可替代假设)的假设的相反假设(原假设)。由于我们可以轻松地指定原假设,但我们不知道替代假设到底是什么。例如,我们可能假设这两个总体之间存在均值差异,但我们无法指出差距有多大。

另请参见不相信原假设吗?


1
如果我正确理解了您的问题,那么标准的频繁假设假设检验是非对称的(替代假设甚至没有出现在其表述中),因此无法拒绝原假设并不意味着它是真的,而替代假设是假的。 。可能是原假设是错误的,但是没有足够的数据来提供证明它是错误的证据。测试施加的自我怀疑是由于假设为真,直到“证实”为止。H0
迪克兰有袋动物

2
我不太确定能否在Fisher / Neyman之后将Popper的证伪逻辑100%应用于统计假设检验。毕竟,波普尔说:“我们不能最终肯定一个假设,但是我们可以最终否定它”。如果我没记错的话,波普尔说,要清楚地假设一个假说,以使其易于被伪造。正如您指出的那样,我们试图拒绝原假设。不确定波普尔是否打算伪造零假设。我认为他宁愿伪造替代假设,也可能是伪造对我们有意义的假设。
Stefan

2
@DikranMarsupial,是的,我知道他的作品,也读过《猜想与驳斥》,花了几个月的时间思考他的著作之后,我认为他所做的假设检验并不能实现他想要的。他还拒绝归纳推理而非演绎推理。我们不是一直都在推理吗?他的逻辑主要适用于物理学,例如,他的主要例子是爱因斯坦如何通过他的计算得出推论,引力会使时空扭曲,从而使光弯曲。然后对此进行了多次测试,此后一直不能拒绝。
Stefan

1
@DikranMarsupial,但我愿意伪造我的陈述:)虽然很棒。
Stefan

2
假设检验的确实现了他的计划的一部分,那就是我们使假设明确可检验和可证伪(至少在概率上)。实际上,统计人员走得更远,实际上需要在进一步进行之前执行测试。我怀疑他可能会赞成贝叶斯假设检验,而不是像常客主义者那样赞成。无论如何,我都不认为伪造主义完全可以令人满意,所以我不介意波普尔没有完全批准!; o)
Dikran Marsupial 2015年

12

Ťpp+1个/2模型定义的协方差。因此,我对此的看法是,正如@whuber在下面的评论中指出的那样,尽管技术上很方便,但null通常是至关重要的。空值是参数空间中的一个点(可能是多变量),因此可以完全指定采样分布。或受限制的参数空间,并且可以将其替代表示为在该空间中是互补的,并且检验统计量基于从替代项下的较丰富参数集到空值项下的限制集之间的距离;或者,在非参数等级/顺序统计世界中,零值下的分布可以通过所有可能样本和结果的完整枚举得出(尽管在大样本中通常可以用某种正常值近似得出)。

H0μ2=μ1个+0.01H1个μ2>μ1个+1个H0μ2=μ1个-0.01H1个μ2<μ1个-1个


5
+1尽管对科学哲学的提法颇具吸引力,但Fisher和Neyman-Pearson先于Popper,而且我相信,主要是由这一至关重要的技术问题驱动的,从而在原假设和替代假设之间造成了不对称。
ub

这(用一个简单的模型,除非它被拒绝)可能会频繁的做法,但我不知道它一定是很好的做法...
比约恩

确切地说,@ whuber,但是出于某种原因,假设检验经常与波普尔的哲学联系在一起。但是零假设的概念可以追溯到Fisher和Neyman-Pearson(如您所述)。他们唯一的共同点是,他们都使用/提出了假设来获取知识-在获取知识和科学方法方面,波普尔显然更具影响力。因此,我认为这就是假设检验(通常包括NHT)的概念与Popper相关联的原因……尽管我可能是错的。
Stefan

1
@whuber和StasK:关于“关键技术问题”,您能否扩大一点?我相信这是指StasK的评论,即在零值下更容易得出测试统计量?也许我应该问一个新的问题,希望可以解决这个问题。
Stefan

11

这是一个公平而好的问题。@Tim已经给您提供了所有您需要以正式方式回答问题的方法,但是,如果您不熟悉统计假设检验,则可以通过在更熟悉的环境中进行思考来概念化原假设。

假设您被指控犯罪。在证明有罪之前,您是无辜的(无效假设)。律师提供您有罪的证据(替代假设),您的律师试图在审判(实验)期间使这一证据无效,最后,法官确定了您是否无罪,因为律师和律师提供了事实。如果反对您的事实不胜枚举,即您无辜的可能性非常低,那么法官(或陪审团)将根据证据证明您有罪。

现在考虑到这一点,您还可以概念化统计假设检验的功能,例如为什么独立的度量(或证据)很重要,因为毕竟您应该得到公平的审判。

但是,这个例子有其局限性,最终您必须正式理解零假设的概念。

因此,回答您的问题:

  1. 是的,存在零假设的原因(如上所述)。

  2. 不,这不只是一个约定,零假设是核心或统计假设检验,否则就无法按预期的方式工作。


7

简约法则(也称为奥卡姆剃刀)是科学的一般原理。根据该原理,我们假设一个简单的世界,直到可以证明该世界更加复杂为止。因此,我们假设原假设是一个更简单的世界,直到它可以被证伪为止。例如:

我们假定处理A和处理B的工作相同,直到显示不同为止。我们假定圣地亚哥之前的天气与哈利法克斯相同,直到我们给出不同的显示为止;我们假设男女薪水相同,直到我们给出不同的显示为止,依此类推。

有关更多信息,请参见https://en.wikipedia.org/wiki/Occam%27s_razor


3

如果我可以对逻辑进行类比,证明某种事物的一般方法是假设相反的事实,看看是否导致矛盾。在这里,原假设是相反的,而拒绝原假设(即表明它不太可能)就像推导出矛盾。

之所以这样做,是因为这是发出明确声明的一种方式。像在我的领域一样,说“'此药无益'的陈述有5%的可能性是正确的”要比说“'此药无益'的陈述有90%的可能性是正确的”要容易得多。当然,人们想知道所要求的收益是多少,但首先,他们想知道收益不为零。


2

零假设总是以拒绝它的意图形成的,这是假设检验的基本思想。当您试图证明某些事情可能是正确的(例如某种疗法改善或恶化一种疾病)时,默认假设为空假设(例如,某种疗法对疾病没有影响)。通过累积(希望)与零假设(本例中被随机分配接受治疗的患者或具有相同预期结果的安慰剂的患者)相距甚远的数据,您可以为所需的索赔生成证据。得出的结论是,在原假设下不太可能出现,因此您可以拒绝原假设。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.