置信区间和可信区间何时重合的示例


11

在有关可信间隔的Wikipedia文章中,它说:

对于单个参数和可以在单个足够统计量中汇总的数据的情况,可以证明,如果未知参数是位置参数(即,前向概率函数具有以下形式),则可信区间和置信区间将重合Pr(x |μ)= f(x −μ)),先验是均匀的平坦分布; [5]并且如果未知参数是比例参数(即,前向概率函数的形式为Pr(x) | s)= f(x / s)),并带有Jeffreys的先验[5]-后者是后继的,因为采用这种比例参数的对数会将其转换为具有均匀分布的位置参数。但是,这些情况显然是特殊的(尽管很重要)。一般而言,不能做到等价。”

人们可以举一些具体的例子吗?95%CI何时真正对应于“ 95%机会”,从而“违反” CI的一般定义?

Answers:


13

正态分布:

采取已知方差的正态分布。我们可以将此方差设为1而不失去一般性(只需将每个观察值除以方差的平方根即可)。这具有抽样分布:

pX1个Xñ|μ=2π-ñ2经验值-1个2一世=1个ñX一世-μ2=一个经验值-ñ2X¯-μ2

其中是仅取决于数据的常数。这表明样本均值是总体均值的足够统计量。如果我们使用统一的先验,则μ的后验分布将是:一个μ

(μ|X1...XN)Normal(X¯,1N)(N(μX¯)|X1...XN)Normal(0,1)

所以一个可信间隔将是以下形式:1α

X¯+1个ñ大号αX¯+1个ñüα

其中ü α被选择成使得标准正态随机变量ž满足:大号αüαž

P[R大号α<ž<üα=1个-α

现在我们可以从这个“关键量”开始构建一个置信区间。的抽样分布固定μ是一个标准的正态分布,因此我们可以代入上面的概率这样的:ñ(μ-X¯μ

P[R大号α<ñμ-X¯<üα=1个-α

然后重新排列以求解,并且置信区间将与可信区间相同。μ

比例参数:

为比例参数,PDF文件具有形式。我们可以采取X|šüÑ˚Föř0s ^,其对应于˚F=1。联合采样分布为:pX一世|s=1个sFX一世sX一世|süñ一世FØ[R0sFŤ=1个

pX1个Xñ|s=s-ñ0<X1个Xñ<s

从中我们发现足够的统计量等于(观测值的最大值)。现在,我们找到其采样分布:X一个X

P[RX一个X<ÿ|s=P[RX1个<ÿX2<ÿXñ<ÿ|s=ÿsñ

现在我们可以通过使它独立于参数。这意味着我们的“枢转量”由下式给出Q = s ^ - 1 X 中号一个XP - [R Q < q = q Ñ其是b Ë 一个Ñ 1 分布。因此,我们可以选择大号αü α使用的β分位数这样的:ÿ=qs=s-1个X一个XP[R<q=qñbËŤ一个ñ1个大号αüα

P[R大号α<<üα=1个-α=üαñ-大号αñ

我们用关键量代替:

P[R大号α<s-1个X一个X<üα=1个-α=P[RX一个X大号α-1个>s>X一个Xüα-1个

还有我们的置信区间。对于使用jeffreys的贝叶斯解决方案,我们有:

p(s|X1...XN)=sN1XmaxrN1dr=N(Xmax)NsN1
Pr(s>t|X1...XN)=N(Xmax)NtsN1ds=(Xmaxt)N

现在我们插入置信区间,并计算其可信度

Pr(XmaxLα1>s>XmaxUα1|X1...XN)=(XmaxXmaxUα1)N(XmaxXmaxLα1)N

=UαNLαN=Pr(Lα<Q<Uα)

和急,我们有信誉和覆盖面。1α


杰作,谢谢!我希望可能会有一个答案,例如“从正态分布计算样本均值时,95%CI实际上也是95%可信区间”或类似的答案。(只是弥补了这个假定的答案,我对具体的例子
韦恩(Wayne

我相信,常客的95%预测/容差区间对应于具有OLS回归和正常误差的贝叶斯预测区间。看起来是这样,无论如何,当我将predict.lm的答案与模拟的答案进行比较时。真的吗?
韦恩

Y=α+βXα,βσ

十分感谢!我一直在尝试针对置信区间对我所做的回归进行解释的配置项,它根本与希望获得可信区间的外行听众无关。使我的生活更加轻松……尽管这可能对整个统计领域不利,因为这将加剧外行对CI的误解。
韦恩

@Wayne-这种情况比地点规模的家庭要普遍得多。如果配置项基于存在的“足够的统计量”(就像这两个),通常,配置项将等效于可信区间。如果没有足够的统计信息,则CI需要以所谓的“辅助统计信息”为条件,以进行可靠的区间解释。
概率
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.