因此,这可能是一个常见问题,但我从未找到令人满意的答案。
您如何确定原假设为真(或假)的概率?
假设您给学生提供了两种不同的测试版本,并且想要查看这些版本是否等效。您执行t检验,其p值为.02。多么好的p值!那一定意味着测试不可能等效,对吗?不会。不幸的是,看来P(results | null)不能告诉您P(null | results)。正常的做法是在遇到低p值时拒绝原假设,但是我们如何知道我们并未拒绝很可能是真的原假设呢?举一个愚蠢的例子,我可以设计一个误报率为0.02的埃博拉病毒测试:将50个球装进一个桶中,并在上面写下“埃博拉病毒”。如果我对此进行测试,然后他们选择“埃博拉”球,则p值(P(捡起球|他们没有埃博拉))为.02,
到目前为止,我已经考虑过的事情:
- 假设P(null | results)〜= P(results | null)–对于某些重要应用显然是错误的。
- 在不知道P(null |结果)的情况下接受或拒绝假设–那么我们为什么接受或拒绝它们呢?难道我们不是要拒绝我们认为是假的而是接受是假的全部吗?
- 使用贝叶斯定理–但是您如何获得先验?您是否最终还是回到原地试图通过实验确定它们?先验地挑选他们似乎很武断。
- 我在这里发现了一个非常类似的问题:stats.stackexchange.com/questions/231580/。这里的一个答案似乎基本上是在说,因为这是贝叶斯问题,所以问零假设为真的可能性是没有意义的。也许我的心是贝叶斯,但我无法想象不问这个问题。实际上,p值最常见的误解似乎是它们是真实零假设的概率。如果您真的不能作为常客问这个问题,那么我的主要问题是#3:如何在不陷入困境的情况下获得先验知识?
编辑:感谢您的所有周到的答复。我想谈谈几个共同的主题。
- 概率的定义:我肯定对此有很多文献,但是我的幼稚概念是“相信完全理性的人会提供信息”或“在这种情况下能使利润最大化的下注几率”被重复,未知数被允许改变”。
- 我们可以知道P(H0 |结果)吗?当然,这似乎是一个棘手的问题。但是我相信,每个概率在理论上都是可以理解的,因为概率总是以给定信息为条件。每个事件都会发生或不会发生,因此没有完整的信息就不存在概率。它仅在没有足够信息时存在,因此应该是可知的。例如,如果我被告知某人有一个硬币,并询问正面的概率,我会说是50%。可能硬币的正面重量为70%,但我没有得到该信息,所以我所拥有的信息的概率为50%,就像它碰巧掉在地上一样,概率为70%当我知道这一点。由于概率总是以一组(不足的)数据为条件,
编辑:“总是”可能太强了。可能存在一些我们无法确定概率的哲学问题。尽管如此,在现实世界中,尽管我们可以“几乎永远”拥有绝对的确定性,但“几乎总是”应该是一个最佳估计。