许多p值的均匀分布是否提供H0为真的统计证据?


28

单个统计检验可以证明无效假设(H0)为假,因此替代假设(H1)为真。但这不能用来表明H0为真,因为未能拒绝H0并不意味着H0为真。

但是,让我们假设您有可能进行多次统计检验,因为您有许多彼此独立的数据集。所有数据集都是同一过程的结果,您想对过程本身做出一些声明(H0 / H1),并且对每个测试的结果都不感兴趣。然后,您收集所有得到的p值,并通过直方图碰巧看到p值明显均匀地分布。

我现在的推理是,只有在H0为true时才会发生这种情况,否则p值的分布将有所不同。因此,这是否足以证明H0为真?还是我在这里缺少一些重要的东西,因为我花了很多心血来写“得出H0为真”的结论,这在我看来真是太过错误了。


1
您可能对我对另一个问题stats.stackexchange.com/questions/171742 / ...的回答感兴趣,在此处对假设有一些评论。
mdewey

根据其定义,H0为假。
约书亚

1
附带说明一下,我之所以进行如此多的测试(而不仅仅是将所有数据组合到一个测试中),是因为我的数据在全球范围内分布,并且我想查看p值(不存在,但如果存在,则意味着违反独立性或H0 / H1在全球不同地区为真)。我没有将其包含在问题文本中,因为我想保持其通用性。
Leander Moesinger

Answers:


22

我喜欢您的问题,但不幸的是我的回答是“否”,它不能证明H0。原因很简单。您怎么知道p值的分布是均匀的?您可能必须运行均匀性测试,该测试将返回您自己的p值,并且最终会遇到您试图避免的相同类型的推理问题,只有一步之遥。而不是寻找在原来的p值H0,现在你看看其他的p值H0大约原始p值的分布的均匀性。

更新

这是示范。我从高斯和泊松分布中生成了100个观测值的100个样本,然后为每个样本的正态性检验获得100个p值。因此,问题的前提是,如果p值来自均匀分布,则证明零假设是正确的,这比统计推断中通常的“不拒绝”要强。问题在于“ p值来自统一”本身就是一个假设,您必须以某种方式对其进行检验。

在下面的图片(第一行)中,我显示了来自Guassian和Poisson样本的正态性检验的p值的直方图,您可以看到很难说一个是否比另一个更均匀。那是我的重点。

第二行显示每个分布的样本之一。样本相对较小,因此您确实不能有太多垃圾箱。实际上,这个特定的高斯样本在直方图上看起来并没有那么多。

在第三行中,我将在直方图上显示每个分布的10,000个观测值的组合样本。在这里,您可以拥有更多的垃圾箱,并且形状更加明显。

最后,我运行相同的正态性检验,并为合并的样本获取p值,它拒绝了Poisson的正态性,而未能拒绝高斯。p值为:[0.45348631] [0.]

在此处输入图片说明

当然,这不是证明,而是您最好对组合样本进行相同测试的想法的证明,而不是尝试分析子样本的p值的分布。

这是Python代码:

import numpy as np
from scipy import stats
from matplotlib import pyplot as plt

def pvs(x):
    pn = x.shape[1]
    pvals = np.zeros(pn)
    for i in range(pn):
        pvals[i] = stats.jarque_bera(x[:,i])[1]
    return pvals

n = 100
pn = 100
mu, sigma = 1, 2
np.random.seed(0)
x = np.random.normal(mu, sigma, size=(n,pn))
x2 = np.random.poisson(15, size=(n,pn))
print(x[1,1])

pvals = pvs(x)
pvals2 = pvs(x2)

x_f = x.reshape((n*pn,1))
pvals_f = pvs(x_f)

x2_f = x2.reshape((n*pn,1))
pvals2_f = pvs(x2_f)
print(pvals_f,pvals2_f)

print(x_f.shape,x_f[:,0])


#print(pvals)
plt.figure(figsize=(9,9))
plt.subplot(3,2,1)
plt.hist(pvals)
plt.gca().set_title('True Normal')
plt.gca().set_ylabel('p-value')

plt.subplot(3,2,2)
plt.hist(pvals2)
plt.gca().set_title('Poisson')
plt.gca().set_ylabel('p-value')

plt.subplot(3,2,3)
plt.hist(x[:,0])
plt.gca().set_title('a small sample')
plt.gca().set_ylabel('x')

plt.subplot(3,2,4)
plt.hist(x2[:,0])
plt.gca().set_title('a small Sample')
plt.gca().set_ylabel('x')

plt.subplot(3,2,5)
plt.hist(x_f[:,0],100)
plt.gca().set_title('Full Sample')
plt.gca().set_ylabel('x')

plt.subplot(3,2,6)
plt.hist(x2_f[:,0],100)
plt.gca().set_title('Full Sample')
plt.gca().set_ylabel('x')

plt.show()

2
@LeanderMoesinger,通过将所有测试集中到一个中,您将提出一个更强的观点。假设您有一个带有100个观察值的样本,并得到p值;然后再获得99个样本,最终得到100个p值。相反,您可以只运行一个10,000个观察值样本并获得p值,但这会更具说服力。
Aksakal

1
@LeanderMoesinger,它可能不小
Aksakal,

1
您的回答没有解决这个问题,他不是问证据而是问证据
卡洛斯·辛纳利

3
@CarlosCinelli,他将拥有许多p值,他认为这是统一的。除非他证明这些价值观是统一的,否则这将如何作为证据?我正是这个意思。
Aksakal

2
@Aksakal这是关于数学的,观察到的事件(如p值序列)可能不构成某些东西的证据,但是从逻辑上讲,原因并非来自您的论点。
卡洛斯·辛纳利

21

n

H0H0

大卫·休ume和归纳问题

H0H0

aA[aB]

  • 几个世纪以来,欧洲人观察到的每只天鹅都是白色的。然后欧洲人发现了澳大利亚,看到了黑天鹅。

  • 几个世纪以来,牛顿的重力定律与观察一致,并被认为是正确的。尽管它被爱因斯坦的广义相对论所推翻。

H0

(不完整的)前进方式清单:

卡尔·波普尔与证伪主义

卡尔·波普尔(Karl Popper)看来,没有科学定律是正确的。我们只有尚未证明是错误的科学定律。

波普尔认为科学是通过猜测假设并使之经受严格审查而前进的。它通过推论(观察证明理论为假)而不是归纳法(重复的观察证明理论为真)前进。大量的常客统计数据都是根据这种哲学而构建的。

波普尔的观点具有巨大的影响力,但是正如库恩和其他人所论证的那样,它并不完全符合从经验上观察到的成功科学实践。

贝叶斯主观概率

θ

θθθP(θ)P(θX)θX。您在各种情况下的行为方式与这些主观概率有一定的对应关系。

这是对自己的主观信念进行建模的逻辑方法,但并不是产生与现实相对应的真实概率的神奇方法。对于任何贝叶斯解释,一个棘手的问题是先验从何而来?另外,如果模型指定不正确怎么办?

乔治·P·鲍克斯

George EP Box的一个著名格言是“所有模型都是错误的,但有些模型是有用的”。

牛顿定律可能并不正确,但对于许多问题仍然有用。Box的观点在现代大数据环境中非常重要,在这种情况下,研究是如此强大,以至于您基本上可以拒绝任何有意义的主张。严格对错是一个不好的问题:重要的是模型是否可以帮助您理解数据。

补充评论

θ0

对多个研究的结果进行统计分析的统计分析也称为荟萃分析

您可以超越狭义的统计解释走多远,这是一个难题。


这是一个有趣的阅读,并提供了一些不错的考虑因素!我希望我可以接受多个答案。
Leander Moesinger

很好的解释。我的教授曾以波普尔的精神总结过库恩:“科学从葬礼发展为葬礼”
skrubber

库恩等人声称波普尔的观察结果与科学的完成方式不符时,会误解波普尔。这被称为本土证伪主义,这不是波普尔(后来)提出的。这是一个稻草人。
康拉德·鲁道夫'18

2
像这样的答案我一直在访问StackExchange网站。
Trilarion '18

5

从某种意义上说,您是对的(请参阅p曲线),但有一些小警告:

  1. pααH0
  2. H0H0

使用实际的应用程序,您往往会遇到其他问题。这些主要是因为没有人/实验室/研究小组通常可以进行所有必要的研究。结果,人们倾向于查看来自许多小组的研究,这时,您对未充分报告,有选择地报告重大/令人惊讶的发现, p-hacking,多次测试/多次测试更正等。


1
(+1)切入点非常重要!不同的理论可以产生观察上等效的数据,而实验设计的关键部分是产生和/或收集可以区分的数据。
马修·冈恩

-2

零假设(H0):重力使宇宙中的所有物体都向地球表面坠落。

备用假设(H1):一切都没有落下。

p<0.01


2
您认为伽利略做了一百万次审判吗?这些东西在物理科学中都不是必需的。通过运用科学方法建立自然法则,并不能简化为统计推断。
Aksakal

1
-1这在科学,统计和历史上都是不准确的。希腊人曾经认为,正是亲和力才将物体吸引到地球上。不错,但是不能很好地解释3+身体系统的问题。假设应该是互补的。最后,将可能的已知偏差表示为H_0并显示实验继续导致相同的错误结论,并不能使结论正确。例如,女性的收入低于男性,而她们的驱动力则较弱,请抽样所有女性的工资,H_0是正确的!
AdamO

@AdamO正是我的意思。
usul

@AdamO,在西方国家,妇女因各种原因而减少工作时的收入减少,这些原因包括她们自己的选择,各种阻碍因素和某些地方的敌对工作环境。当他们工作相同时,他们的收入大致相同,例如,在女性占多数的情况下,查看医疗保险护士的工资:medscape.com/slideshow/…。他们每个小时工作的收入都是37美元。当然完全是题外话。
Aksakal

2
如果您的原假设是Gravity causes everything in the universe to fall toward Earth's surface替代假设There is at least one thing in the universe that does not fall toward the Earth's surface,不是Nothing ever falls吗?
Eff
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.