为什么我们不利用t分布来构造比例的置信区间?


18

要计算具有未知总体标准偏差(sd)的均值的置信区间(CI),我们采用t分布估算总体标准差。值得注意的是,CI=X¯±Z95%σX¯其中。但是因为我们没有总体标准偏差的点估计,所以我们通过近似进行估计,其中σX¯=σnCI=X¯±t95%(se)se=sn

相反,对于人口比例,要计算CI,我们近似为其中提供和CI=p^±Z95%(se)se=p^(1p^)nnp^15n(1p^)15

我的问题是,为什么我们对人口比例的标准分布感到自满?


1
我的直觉是,这是因为要获取平均值的标准误差,您需要第二个未知数,它是从样本中估算出来的,以完成计算。比例的标准误差不涉及其他未知数。σ
恢复莫妮卡-G.辛普森

@GavinSimpson听起来令人信服。实际上,我们引入t分布的原因是为了补偿引入的误差,以补偿标准偏差的近似值。
阿披吉特(Abhijit)

3
我发现这不足以令人信服,部分原因是t分布来自正态分布样本中样本方差和样本均值的独立性,而对于二项分布样本而言,这两个量并不独立。
ub

@Abhijit有些教科书确实使用t分布作为此统计的近似值(在某些条件下)-他们似乎使用n-1作为df。尽管我还没有看到一个很好的形式上的论据,但是这种近似似乎确实运作得很好。对于我检查过的情况,它通常比正常近似要好一些(但是对于t近似而言,它没有一个可靠的渐近论证)。[编辑:我自己的支票或多或少类似于那些胡扯的表演;z和t之间的差异远小于与统计数据的差异]
Glen_b-恢复莫妮卡(Monica),

1
可能有一个可能的论点(例如,可能基于序列展开的早期术语)可以确定应该总是总是期望t更好,或者在某些特定条件下应该更好。还没有见过这种说法。就我个人而言,我通常会坚持使用z,但是我不担心有人使用t。
Glen_b-恢复莫妮卡

Answers:


20

标准正态分布和学生t分布都不太近似于

Z=p^pp^(1p^)/n

对于小n,如此之差,以至于误差使这两个分布之间的差异相形见.。

以下是所有三个分布(省略其中箱子的比较p1 - p是零,其中,所述比率是未定义),用于Ñ = 10 p = 1 / 2 p^1p^n=10,p=1/2:

图1

的“经验”分布是,Z,因为估计必须是离散的p被限制在有限集合{ 0 1 / Ñ 2 / Ñ ... ñ / Ñ } p^{0,1/n,2/n,,n/n}.

t分发用来做近似的工作做得更好。

对于n=30p=1/2,可以看到标准正常和学生t分布之间的差异完全是可以忽略不计:

图2

因为Student t分布比标准正态分布更复杂(实际上,它是由“自由度”索引的整个分布族,以前需要表格的整个章节而不是单个页面),所以几乎所有的标准正态分布近似值。


2
质量答案。+1
Demetri Pananos

10

用于使用置信区间t分布为平均的理由依赖于底层数据遵循正态分布,这导致卡方分布估计的标准偏差时,以及假设从而x¯μs/ntn1。在假设数据完全正常的情况下得出的结果是精确的,当使用t时得出置信区间的准确度为95%,如果使用z则小于95%。

在瓦尔德区间比例的情况下,你只能得到渐近正p - pp^pp^(1p^)/n当n是足够大的,它依赖于第 由于成功的基础计数是离散的,因此该过程的实际覆盖概率有时会低于,有时甚至会高于95%的标称覆盖率,具体取决于未知p。因此,没有理论上的理由使用t,并且不能保证从实际的角度来看,仅使用t来使间隔更宽实际上将有助于实现95%的名义覆盖率。

尽管可以很容易地模拟覆盖率,但是可以准确计算覆盖率。以下示例显示了n = 35时的模拟覆盖率。它表明使用z区间的覆盖率通常略小于.95,而t区间的覆盖率通常通常平均更接近.95,这取决于您先前对p的合理值的看法。 。

在此处输入图片说明

在此处输入图片说明


3
+1这些是我提出的关于Student t和Normal CI相对准确度的主张的很好的说明(仅基于检查CDF的图表,而不是严格的演示)。
ub

6

AdamO和jsk都给出了很好的答案。

我会尝试用简单的英语重复他们的观点:

当基础分布为正态分布时,您将知道有两个参数:meanvariance。T分布提供了一种在不知道方差的确切值的情况下进行均值推断的方法。代替使用实际方差,仅需要样本均值和样本方差。因为它是精确的分布,所以您确切地知道所得到的。换句话说,覆盖率是正确的。t的使用仅反映了绕过未知的人口方差的愿望。

但是,当我们推断比例时,基本分布是二项式的。要获得准确的分布,您需要查看Clopper-Pearson置信区间。您提供的公式是Wald置信区间的公式。它使用正态分布来近似二项式分布,因为正态分布是二项式分布的极限分布。在这种情况下,由于您仅是近似值,因此使用t统计量获得的额外精度水平变得不必要,而所有这些都取决于经验性能。正如BruceET的回答所建议的那样,如今的Agresti-Coull是简单的标准公式,可用于这种近似。

我的德克萨斯A&M教授Longnecker博士做了一个简单的模拟,以说明与基于二项式的CI相比,不同的近似是如何工作的。

Comparison of Various 95% C.I.’s for Proportion

可以在《统计科学》中的二项式比例的区间估计中找到更多信息。L.Brown,T.Cai和A.DasGupta,第16卷,第101-133页。基本上,对于n> = 40,建议使用AC CI。

enter image description here


3

正常均值的置信区间。假设我们有一个来自正常总体的随机样本X1,X2,Xn。让我们看一下假设检验中正常均值μ的置信区间。如果σ是已知的,那么一个的双侧检验H0:μ=μ0针对Ha:μμ0是基于统计Z=X¯μ0σ/n.H0为真,ZNorm(0,1),所以我们拒绝H0在5%的水平,如果|Z|1.96.

然后“反向测试”,我们说的95%CI μ由值μ0不引起排斥反应-的“可信”值μ.该CI的形式为X¯±1.96σ/n,其中标准正态分布的上,下尾分别有±1.96切割概率0.025。

如果人口标准偏差σ是未知的,并且通过由样本标准偏差估计S,然后我们用统计T=X¯μ0S/n.TnSσ.

TT(ν=n1),n1σX¯±tS/n,±tT(n1).

n>30,t21.96.Sσσn>30,

Xnp^=X/np.H0:p=p0Ha:pp>0,Z=p^p0p0(1p0)/n.H0,ZaprxNorm(0,1).H0|Z|1.96.

p,p^±1.96p(1p)n.pn,p^p.p^±1.96p^(1p^)n.n

nˇ=n+4pˇ=(X+2)/nˇpˇ±1.96pˇ(1pˇ)nˇ.

μp

Sσσ

p^pp^p.pn.


2

σ

σ

σ

σ

此外,应该注意的是,这个问题的镜子答案通过征求这个问题


2
Gosset的化名是“ Student”而不是“ Student-T”。他还没有真正提出标准的t分布本身,也没有真正地处理t统计量(他做了相当的事情,本质上是处理比例t,但是现在我们几乎所有的形式主义都来了)从费舍尔的作品中)。费舍尔以我们编写统计数据的方式编写统计数据。费舍尔称它为t。Fisher正式得出了统计量的分布(显示Gosset的代数,直觉和伴随的模拟参数对他的统计量的组合形式是正确的)
Glen_b -Reinstate Monica

1
看到这里戈塞特的1908年纸:archive.org/details/biometrika619081909pear/page/n13 -也有在乳胶纸重做一个很好的读取PDF 这里。请注意,这已经失去版权,因为它距Steamboat Willie已有数年之久。
Glen_b-恢复莫妮卡

@Glen_b谢谢!我删除了历史上显然错误的轶事。
AdamO
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.