在许多地方,我读到我们永远不能说我们“接受”原假设。相反,我们必须说我们“未能拒绝”原假设。
但是我不认为这与这个简单的例子如何相吻合:假设我们正在测试一种应该在24小时内完全治愈糖尿病的药物。我们对1000名患者进行了尝试,所有患者在服药后仍然患有糖尿病。
这种药物不能治愈糖尿病不是很明显吗?即,我们接受原假设吗?
我当然不会相信这种药物。
无假设:该药对患者无影响。
替代假设:该药物可治疗糖尿病
在许多地方,我读到我们永远不能说我们“接受”原假设。相反,我们必须说我们“未能拒绝”原假设。
但是我不认为这与这个简单的例子如何相吻合:假设我们正在测试一种应该在24小时内完全治愈糖尿病的药物。我们对1000名患者进行了尝试,所有患者在服药后仍然患有糖尿病。
这种药物不能治愈糖尿病不是很明显吗?即,我们接受原假设吗?
我当然不会相信这种药物。
无假设:该药对患者无影响。
替代假设:该药物可治疗糖尿病
Answers:
可能性一:该药作用很小。 也许它可以治愈0.000001%的服用它的人。您概述的测试仅意味着没有足够的证据来证明您提出的替代方案。
可能性二:该药具有很强的负面作用。(贷记@ssdecontrol) 也许这种药物没有效果,所有这些患者自己都会好起来,但是由于这种药物,没有一个患者康复。
没有任何先验知识,数据将与这些可能性以及null为真的可能性一致。
因此,不拒绝null并不意味着null比这些其他可能性更正确。
这里有一些很好的答案,但是我认为关键问题并未在任何地方明确说明。 简而言之,您对原假设和替代假设的表述无效。 空假设和替代假设必须是互斥的(也就是说,它们不能都为真)。您的配方符合该标准。但是,它们也必须是集体穷举的(也就是说,其中之一必须是正确的)。您的配方不符合此标准。
您不能有一个虚假的假设,即该药物治愈糖尿病的几率是,而另一个假设是该药物具有治愈糖尿病的几率。想象一下,该药治愈糖尿病的真实概率为,那么您的零假设和替代假设都是错误的。那是你的问题。
原型零假设是一个点值(例如,在实数线上为,当提及概率时,通常为,但这只是惯例)。另外,如果您正在使用有界参数空间(如此处所示,概率必须在范围内),则尝试测试处于极限(即或值通常是有问题的)。既然选择了一个点值作为空(您想拒绝的值),你可以得到的证据反对,但不能得到证据为根据您的数据(参见@约翰它见解的答复)。为了进一步了解这一点,它可以帮助您在此处阅读我的答案:为什么统计学家说不重要的结果意味着“您不能拒绝零”而不是接受零假设? 要将这些想法更具体地应用于您的情况,即使您的空值是(因此您的替代假设是),并且您已经在患者中尝试了该药物而没有一个治愈后,您将无法接受零假设:数据仍然与概率为的可能性相一致(请参阅:如果没有失败,如何判断失败的概率?)。
在另一方面,你不具备有一点空。例如,单尾(即)空假设不是点。它们是无限点的集合。同样,您可能还具有范围/区间假设(例如,参数在)。在这种情况下,您可以根据证据接受空值,这就是等效测试的全部内容。(当然,您仍然可能会犯I型错误。)
正如其他用户所评论的那样,接受原假设的问题是我们没有足够的证据(也永远不会)得出该效应完全为0的结论。在数学上,假设检验通常无法回答此类问题。
但是,这并不意味着您提出的问题不是一个有效的问题!实际上,这通常是仿制药临床试验的目的:其目的不是表明您生产了更有效的药物,而是您的药物实质上与名牌一样有效(并且您可以生产它的成本要低得多)。通常将等价视为原假设。
为了使用假设检验解决这个问题,对问题进行了重新设计,使其可以得到回答。重新格式化的问题看起来像这样:
其中是仿制药的效果,是品牌药的效果。因此,现在如果我们拒绝零假设,我们可以得出结论,该通用品牌至少与该品牌的75%相同。显然,这与完全等同并不相同,但是它可以解决您感兴趣的问题(并且在某种程度上,我认为这是一个在数学上更合理的问题)。β Ñ b
我们可以以类似方式处理您的问题。与其试图说“我们是否有足够的证据来得出0效应?”,不如问“给出我们的证据,我们的结果并不太奇怪的最大效应是什么?”。在并且成功0的情况下,可以声称我们有足够的证据得出成功概率小于0.3%(基于Fisher的精确检验,)。α = 0.05
从这个结果可以肯定,您仍然可以得出结论,这不是您会相信的药物。
说您永远不会接受原假设是不正确的。您正在使教科书信息脱离上下文。您不能做的就是使用空假设检验来接受它。该检验用于拒绝该假设。请注意,您自己接受的论点与测试结果无关。这与数据有关。在您的示例中根本无法进行测试会很愚蠢。您可以使用数据来论证您接受原假设。没有错。您只是不能使用测试结果来这样做。
您不能全部使用假设检验的原因是因为它并非旨在执行此假设。如果您不从教科书中了解这一点,那是可以理解的。这实际上是一个有趣的悖论,即p值仅在null为true时才真正有意义,但不能用来证明null为true。为了使其更容易,也许只需考虑功率灵敏度。您总是可以收集的样本太少而无法拒绝null。由于可以做到这一点,因此很明显,单独测试并不是接受null的有效理由。但这并不意味着您永远不能说null为真。这仅意味着测试不是争论null为真的基础。
注意:有一个Occam的剃刀参数,当您不拒绝时,应该接受null;否则,您将接受null。但测试并未告诉您接受null。您正在执行的操作是接受null作为默认值,并且如果您不拒绝测试,那么您将保持默认状态。因此,即使在这种情况下,由于测试,也不接受null。