我们能否拒绝通过抽样产生置信区间的零假设而不是零假设?


9

我被教导,我们可以从总体中采样后以置信区间的形式生成参数估计。例如,在没有违背假设的情况下,95%的置信区间应具有95%的成功率,其中包含我们估计的总体中真实参数是什么。

  1. 从样本产生点估计。
  2. 产生一个范围内的值,理论上有95%的机会包含我们尝试估计的真实值。

但是,当主题变为假设检验时,步骤描述如下:

  1. 假设某个参数为原假设。
  2. 给定该原假设,则得出获得各种点估计值的可能性的概率分布。
  3. 如果原假设为真,则如果我们得到的点估计的产生时间少于5%,则拒绝原假设。

我的问题是这样的:

为了拒绝零值,是否有必要使用零值假设来产生我们的置信区间?为什么不只是执行第一个过程并获得我们对真实参数的估计(在计算置信区间时未明确使用我们的假设值),然后拒绝零假设(如果它不在此区间内)?

从逻辑上讲,从直觉上看,这在逻辑上等效于我,但是我担心我错过了一些非常基本的东西,因为可能有这样一种教导。


马丁(Martijn),我对此表示不清楚。我将尽快编辑我的帖子,以使将来查找相同问题的人更清楚。我的意思是我们可以从样本中计算出一个参数估计值,或者我们可以计算一个估计值范围,我们可以认为该估计值可以使用无效假设来支持无效假设。我不明白为什么必须使用null来查看我们的点估计是否在此间隔内,而不是简单地使用我们的参数估计并检查null是否在参数估计的范围内。我希望这是有道理的!
Nikli

一个有趣的思想实验是,如果有人尝试向您出售加权骰子。他们滚动它们,然后说出它们在您观察到的方向上处于加权状态(例如6出现20%的时间)。是否对它们进行加权(是否完成了足够的样本投掷),加权多少?您自己进行(额外)骰子投掷测试值得什么?买卖双方有不同的目标……
菲利普·奥克利

Answers:


5

例如,通过测试具有已知方差的正态总体的均值来给出一个简单的问题。然后,通过给出枢轴-一个其分布不依赖于参数的数量。在这种对称情况下,临界值满足和。σ2=1Y¯μN(0,1/n)zα/2Φ(zα/2)=α/2Φ(zα/2)=1α/2

因此, 这样 是级别的置信区间。

1α=Pr{(X¯μ)/(1/n)(zα/2,zα/2)}=Pr{zα/2(X¯μ)nzα/2}=Pr{zα/2(μX¯)nzα/2}=Pr{zα/2/nμX¯zα/2/n}=Pr{X¯zα/2/nμX¯+zα/2/n}=Pr{(X¯zα/2/n,X¯+zα/2/n)μ}
(X¯zα/2/n,X¯+zα/2/n)
1α

同时,在显示的第一行中的事件恰好也是该不拒绝零假设的事件。由于其余的仅包含等效的格式,因此ci确实包含所有,其中不拒绝null,因此无需引用“在null以下”。μμ

这是类似于Martijn +1可视化的图表,旨在显示置信区间和检验之间的对偶。表示属于某个的置信区间,而属于某个假设的接受区域。Cx¯A(μ0)μ=μ0

在此处输入图片说明


10

是的,您可以通过与样本计算出的置信区间进行比较来代替假设检验(将样本与假设的检测结果分布进行比较)。但是间接地,置信区间已经是一种假设检验,即:

  • 您可能会看到置信区间被构造为级别假设检验将成功的值范围,α而超出级别假设检验将失败的值范围。α

设置此范围的结果是该范围仅失败了时间的分数。α

我正在使用以下问题的答案中的图片:置信区间:如何正式处理P(L(X)θ,U(X)θ)=1α

它是Clopper-Pearson图的一种变体。想象一下,100次伯努利试验的情况下,成功的概率是,我们观察到成功的总数。θX

基准概率

注意:

  • 在垂直方向上,您会看到假设检验。例如,对于给定的假设值,如果测得的在红色或绿色虚线上方或下方,则您拒绝该假设。θX

  • 在水平方向上,您会看到Clopper-Pearson置信区间。如果对于任何给定的观察值X,您使用这些置信区间,那么只有5%的时间您会错

    (因为您只会观察到这样的X,因此您有5%的时间基于“错误”间隔)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.