快速回答
其理由是因为,假设数据是独立同分布和Xi∼N(μ,σ2),并限定
X¯S2==∑NXiN∑N(X¯−Xi)2N−1
形成置信区间的情况下,与所述样本方差(相关联的采样分布
S2!,记住,一个随机变量)是卡方分布(
S2(N−1)/σ2∼χ2n−1),就像用样本均值相关联的抽样分布是一个标准的正态分布(
(X¯−μ)n−−√/σ∼Z(0,1)),当你知道的方差,并且与当你不叔学生(
(X¯−μ)n−−√/S∼Tn−1)。
长答案
首先,我们将证明,S2(N−1)/σ2如下与卡方分布ñ− 1自由度。之后,我们将看到该证明在推导方差的置信区间时如何有用,以及卡方分布如何显示(以及为什么如此有用!)。让我们开始。
证据
为此,也许您必须习惯此Wikipedia文章中的卡方分布。这个分布仅仅具有一个参数:自由度,的,并碰巧具有矩生成函数(MGF)由下式给出:
米χ 2 ν(吨)= (1 - 2 吨)- ν / 2。
如果我们能表明的分布小号2(Ñ - 1 )/ σ 2具有像这样的一个时刻生成函数,但与ν =ν
米χ2ν(t )= (1 − 2 t )- ν/ 2。
小号2(N− 1 )/ σ2,则我们已经表明,
小号2(Ñ - 1 )/ σ 2如下与卡方分布
ñ - 1个自由度。为了显示这一点,请注意两个事实:
ν= N− 1小号2(N− 1 )/ σ2ñ− 1
如果我们定义,
其中ž我〜Ñ(0,1),即,标准正态随机变量,瞬间生成函数ý由下式给出
米ý(吨)
Y=∑(Xi−X¯)2σ2=∑Z2i,
Zi∼N(0,1)YZ2
的MGF由
m Z 2(t )给出米ÿ(吨)===è [ èŤ ÿ]è [ èŤ ž21个] × E [ eŤ ž22] × 。。。è [ èŤ ž2ñ]米ž2一世(t )× 米ž22(t )× 。。。米ž2ñ(t )。
ž2
其中,我已经使用标准正态,的PDF˚F(ż)=ë- ž 2 / 2/√米ž2(吨)==∫∞- ∞F(z)exp(吨ž2)dz(1−2t)−1/2,
,因此,
米ÿ(吨)=(1-2吨) - ñ / 2,
这意味着ý如下与卡方分布Ñ自由度。f(z)=e−z2/2/2π−−√mY(t)=(1−2t)−N/2,
YN
Y1Y2ν1ν2W=Y1+Y2ν1+ν2W
N−1
(N−1)S2=−n(X¯−μ)+∑(Xi−μ)2,
σ2
注意,该和的左侧的第二项以具有1个自由度的卡方分布分布,而右侧的和以具有
N个自由度的卡方分布。
因此,š2(Ñ-1)/σ2分配作为卡方与ñ-1个自由度。
(N−1)S2σ2+(X¯−μ)2σ2/N=∑(Xi−μ)2σ2.
NS2(N−1)/σ2N−1
计算方差的置信区间。
L1L2
P(L1≤σ2≤L2)=1−α.
S2(N−1)L1S2(N−1)≤σ2S2(N−1)≤L2S2(N−1).
S2(N−1)/σ2N−1L1S2(N−1)≤σ2S2(N−1)σ2S2(N−1)≤L2S2(N−1)⇒⇒S2(N−1)σ2≤S2(N−1)L1,S2(N−1)L2≤S2(N−1)σ2,
P(S2(N−1)L2≤S2(N−1)σ2≤S2(N−1)L1)=1−α.
S2(N−1)/σ2∼χ2(N−1)∫N−1S2(N−1)L2pχ2(x)dx∫S2(N−1)L1N−1pχ2(x)dx==(1−α)/2 ,(1−α)/2
(we integrate up to
N−1 because the expected value of a chi-squared random variable with
N−1 degrees of freedom is
N−1) or, equivalently,
∫S2(N−1)L20pχ2(x)dx=α/2,∫∞S2(N−1)L1pχ2(x)dx=α/2.
Calling
χ2α/2=S2(N−1)L2 and
χ21−α/2=S2(N−1)L1, where the values
χ2α/2 and
χ21−α/2 can be found in chi-square tables (in computers mainly!) and solving for
L1 and
L2,
L1L2==S2(N−1)χ21−α/2,S2(N−1)χ2α/2.
Hence, your confidence interval for the variance is
C.I.=(S2(N−1)χ21−α/2,S2(N−1)χ2α/2).