如何理解自由度?


257

Wikipedia中,对统计自由度有三种解释:

在统计中,自由度数是统计的最终计算中可以自由变化的值的数目。

统计参数的估计可以基于不同数量的信息或数据。进入参数估计的独立信息的数量称为自由度(df)。通常,参数估计的自由度等于进入估计的独立分数的数量减去在参数本身的估计中用作中间步骤的参数的数量(在样本方差中为一,因为样本均值是唯一的中间步骤)。

在数学上,自由度是随机向量的域的维数,或本质上是“自由”分量的数量:在完全确定向量之前,需要知道多少个分量

粗体字是我不太了解的内容。如果可能,一些数学公式将有助于阐明这一概念。

这三种解释是否也彼此一致?


看看这个解释
George Dontas

3
另请参见以下问题“什么是自由度?”
Jeromy Anglim

Answers:


242

这是一个微妙的问题。 需要一个有思想的人才能不理解这些报价!尽管它们是暗示性的,但事实证明它们都不是完全正确或普遍正确的。我没有时间(这里没有空间)进行完整的阐述,但是我想分享一种方法和它所建议的见解。

自由度(DF)的概念出现在哪里? 在基本治疗中发现的上下文是:

  • Student t检验和其变体,如韦尔奇或萨特思韦特解决方案的贝伦斯-费希尔问题(其中两个种群具有不同的方差)。

  • 卡方分布(定义为独立标准法线的平方和),与方差采样分布有关。

  • 所述F检验(估计方差的比率)。

  • 卡方检验,包括其在(a)中的检测用途在应急表独立性和(b)用于分配估计的拟合优度测试。

从本质上讲,这些测试的范围从准确的(学生t检验和F检验为正态变量)到良好的近似值(学生t检验和Welch / Satterthwaite检验,数据不太偏斜) )到基于渐近逼近(卡方检验)。其中一些有趣的方面是非整数“自由度”(Welch / Satterthwaite检验,以及我们将看到的卡方检验)的出现。这是特别令人感兴趣的,因为这是DF 并不是它声称的任何东西的第一个提示。

我们可以立即处理该问题中的某些主张。 由于“统计的最终计算”的定义不明确(显然取决于一个人使用哪种算法进行计算),因此它仅是一个模糊的建议,不值得进一步批评。类似地,“进入估计的独立分数的数量”和“用作中间步骤的参数的数量”都没有明确定义。

“进入[估计]的独立信息”很难处理,因为这里存在两种不同但密切相关的“独立”感觉。一是随机变量的独立性。另一个是功能独立性。 作为后者的一个例子,假设我们收集的受试者形态测量-比方说,为简单起见,这三个边长,,,表面积,和体积的一套木块。可以将三个边长视为独立的随机变量,但是所有五个变量都是相关的RV。这五个在功能上Y Z S = 2XYZV = X ý Ž X ÿ Ž 小号V - [R 5 ω ∈ - [R 5 ˚F ω ω ˚F ωX ψ ... V ψ = 0 ωS=2(XY+YZ+ZX)V=XYZ因为向量值随机变量的共不是 “域”!)是的三维流形。(因此,在任何地方,都有两个函数和,其中和对于点 “近”的和和导数在处进行评估(X,Y,Z,S,V)R5ωR5fωgωfω(X(ψ),,V(ψ))=0ψ ω ˚F ω X 小号V gω(X(ψ),,V(ψ))=0ψωfgω是线性无关的),但是-这就是意料之外-有关块上有许多可能性的措施,这些变量如的子集是依赖为随机变量,但是在功能上独立。(X,S,V)

在意识到这些潜在的歧义之后,让我们举起卡方拟合优度检验进行检查,因为(a)这很简单,(b)这是人们确实需要了解DF才能获得的普遍情况之一。 p值权利和(c)经常使用不正确。这是该测试争议最小的应用的简要提要:

  • 您有一个数据值集合,被视为总体样本。(x1,,xn)

  • 您已经估计了分布的一些参数。例如,您估计正态分布的均值和标准偏差,假设总体是正态分布的,但不知道(获取数据之前)或可能是什么。θ 1 θ 2 = θ p θ 1 θ 2θ1,,θpθ1θ2=θpθ1θ2

  • 事先,您为数据创建了一组 “容器”。(即使经常这样做,当由数据确定容器时也可能会出现问题。)使用这些容器,数据将减少到每个容器内的计数集。预期的真实值可能是多少,您已对其进行了安排,以使(希望)每个bin接收到的计数大致相同。(等概率合并确保卡方分布确实非常接近即将描述的卡方统计量的真实分布。)θ k(θ)

  • 您拥有大量数据-足以确保几乎所有垃圾箱的计数都应为5或更大。(我们希望,这将使统计信息的抽样分布能够通过某些分布来适当地近似。)χ 2χ2χ2

使用参数估计值,可以计算每个仓中的预期计数。卡方统计量是比率的总和

(observedexpected)2expected.

许多权威人士告诉我们,这应该具有(非常近似)卡方分布。但是有这样的分布的整个家族。它们通过通常称为“自由度” 的参数来区分。 关于如何确定的标准推理是这样的ννν

我有计数。那是个数据。但是它们之间存在(功能)关系。首先,我事先知道计数的总和必须等于。那是一种关系。我从数据中估计了两个(通常是)参数。那是两个(或)附加关系,总共提供了个关系。假设它们(参数)都是(功能上)独立的,则仅留下(功能上)独立的“自由度”:这是使用值。ķ Ñ p p p + 1 ķ - p - 1 νkknppp+1kp1ν

这种推理的问题(这是问题中引号所暗示的一种计算)是错误的,除非满足某些特殊的附加条件。 此外,这些条件都没有做独立(功能或统计),与数据的“组件”的数字,随着参数的数量,也没有与任何在原来的问题别人提及。

让我举一个例子。(为使内容尽可能清楚,我使用了少量的容器,但这不是必需的。)让我们生成20个独立且分布均匀的(iid)标准正态变量,并使用常用公式估算其均值和标准差(平均值=总和/计数)。要测试拟合优度,请在标准法线的四分位数处创建带有切点的四个bin:-0.675、0,+ 0.657,然后使用bin计数生成卡方统计量。耐心重复一次;我有时间重复10,000次。

关于DF的标准观点说,我们有4个bin和1 + 2 = 3个约束,这意味着这10,000个卡方统计量的分布应遵循具有1个DF的卡方分布。这是直方图:

图1

深蓝色线表示分布的PDF我们认为可以使用),而深红色线表示分布的PDF (这很好猜猜是否有人告诉您不正确)。 两者都不适合数据。χ 22 ν = 1χ2(1)χ2(2)ν=1

您可能会认为该问题是由于数据集的大小( = 20)或bins的数目小而引起的。但是,即使使用非常大的数据集和大量的bin,问题仍然存在:这不仅是无法实现渐近逼近。n

事情出了问题,因为我违反了卡方检验的两个要求:

  1. 您必须使用参数的最大似然估计。(实际上,可以稍微违反此要求。)

  2. 您必须基于计数而不是实际数据进行估算!(这很关键。)

图2

红色直方图描述了遵循这些要求的10,000次独立迭代的卡方统计量。果然,它显然遵循了曲线(具有可接受的采样误差),正如我们最初希望的那样。χ2(1)

这种比较的重点(我希望您已经看到了这一点)在于,用于计算p值的正确DF取决于许多因素,不是歧管的尺寸,功能关系的数量或正态变量的几何形状。如数量之间的数学关系以及数据的分布,其统计量以及由此形成的估计量之间的数学关系所发现,某些功能依赖项之间存在微妙的微妙相互作用。因此,就多元正态分布的几何形状,功能独立性,参数数量或任何其他性质而言,不能完全解释DF。

因此,我们被引导到,“自由度”仅仅是一种启发式方法,它暗示了(t,卡方或F)统计量的抽样分布应该是什么,但它不是确定性的。 相信它是定性的会导致严重错误。(例如,当搜索“卡方拟合优度”时,在Google上排名最高的常春藤盟校的网页,其中大部分都完全错误!尤其是,根据其指令进行的模拟显示,卡方推荐的值,因为7 DF实际上有9 DF。)

有了这种更加细致入微的理解,就值得重新阅读有问题的Wikipedia文章:在细节上它可以使事情变得正确,指出DF启发式方法在哪里起作用,或者在哪里是近似值或根本不适用。


肯德尔和斯图尔特(Kendall&Stuart)第5卷第2卷对此现象进行了很好的说明(卡方GOF测试中出乎意料的高DF)。我很感谢这个问题提供的机会,使我回到这份精彩的文本中,其中充满了有用的分析。


编辑(2017年1月)

以下是R产生代码的代码,该代码遵循“关于DF ...的标准知识”。

#
# Simulate data, one iteration per column of `x`.
#
n <- 20
n.sim <- 1e4
bins <- qnorm(seq(0, 1, 1/4))
x <- matrix(rnorm(n*n.sim), nrow=n)
#
# Compute statistics.
#
m <- colMeans(x)
s <- apply(sweep(x, 2, m), 2, sd)
counts <- apply(matrix(as.numeric(cut(x, bins)), nrow=n), 2, tabulate, nbins=4)
expectations <- mapply(function(m,s) n*diff(pnorm(bins, m, s)), m, s)
chisquared <- colSums((counts - expectations)^2 / expectations)
#
# Plot histograms of means, variances, and chi-squared stats.  The first
# two confirm all is working as expected.
#
mfrow <- par("mfrow")
par(mfrow=c(1,3))
red <- "#a04040"  # Intended to show correct distributions
blue <- "#404090" # To show the putative chi-squared distribution
hist(m, freq=FALSE)
curve(dnorm(x, sd=1/sqrt(n)), add=TRUE, col=red, lwd=2)
hist(s^2, freq=FALSE)
curve(dchisq(x*(n-1), df=n-1)*(n-1), add=TRUE, col=red, lwd=2)
hist(chisquared, freq=FALSE, breaks=seq(0, ceiling(max(chisquared)), 1/4), 
     xlim=c(0, 13), ylim=c(0, 0.55), 
     col="#c0c0ff", border="#404040")
curve(ifelse(x <= 0, Inf, dchisq(x, df=2)), add=TRUE, col=red, lwd=2)
curve(ifelse(x <= 0, Inf, dchisq(x, df=1)), add=TRUE, col=blue, lwd=2)
par(mfrow=mfrow)

40
这是一个了不起的答案。您为此赢得了互联网。
亚当

6
@caracal:您知道,原始数据的ML方法是常规且广泛使用的:例如,对于正态分布,的MLE 是样本均值,的MLE 是样本标准差的平方根(无需通常的偏差校正)。为了获得基于计数的估计值,我计算了计数的似然函数-这需要在切点处计算CDF的值,取其对数,乘以计数,然后相加-并使用通用优化软件对其进行优化。σμσ
whuber

4
@caracal您可能不再需要它,但是R现在在一个相关的问题中出现了一个示例,用于对装箱数据进行ML拟合:stats.stackexchange.com/a/34894
ub

1
“这种推理的问题(这是问题中的报价所暗示的一种计算)是错误的,除非有一些特殊的附加条件成立。” 我现在(几乎)已经完成了线性模型序列的两个学期,并且我了解自由度是矩阵在二次形式“中间”的等级。这些“附加条件”是什么?
单簧管

4
@单簧管我的回答的主要重点是建议您所教的内容是基于DF的两个概念的混淆。尽管这种混淆对于标准最小二乘正态理论模型不会造成任何问题,但即使在简单,常见的情况(例如列联表分析)中,也会导致错误。该矩阵等级给出了功能 DF。在最小二乘线性模型中,碰巧会为某些类型的测试(例如F测试)提供正确的DF。对于卡方检验,稍后在答案中将特殊条件列举为点(1)和(2)。
whuber

74

或者简单地说:允许更改数字数组中的元素数,以使统计值保持不变。

# for instance if:
x + y + z = 10

您可以随意更改xy,但不能更改z(可以但不能随意更改,因此您不能随意更改它-请参阅Harvey的评论),“因为您将更改值统计量(Σ= 10)。因此,在这种情况下df = 2。


19
说“您不能更改z”并不完全正确。实际上,您必须更改z才能使总和等于10。但是,您对z的变化没有选择(没有自由)。您可以更改任何两个值,但不能更改第三个。
哈维·莫图尔斯基

53

给定一些有关维欧几里德几何,子空间和正交投影的常识,对该概念进行数学精确化并不困难。n

如果是从到维子空间的正交投影,并且是任意矢量,则在,和是正交的,并且在的正交补码中。此正交补码的尺寸为。如果在维空间中自由变化,则在维空间中自由变化。- [R Ñ p 大号X Ñ P X 大号X - P X P X X - P X 大号大号大号 ñ - p X ñ X - P X ñ - p X - P X ñ - pPRnpLxnPxLxPxPxxPxLLLnpxnxPxnp维空间。因此,我们说具有个自由度xPxnp

这些考虑对于统计很重要,因为如果是维随机向量,而是其均值的模型,即均值向量在,则我们将称为残差向量,然后我们使用残差来估计方差。残差矢量具有个自由度,也就是说,它被约束为维的子空间。n L E X L X - P X n - p n - pXnLE(X)LXPXnpnp

如果的坐标是独立的并且正态分布具有相同的方差则σ 2Xσ2

  • 向量和是独立的。X P XPXXPX
  • 如果,则残差矢量的平方范数的分布| | X P X | | 2是一个χ 2 -配送与尺度参数σ 2和恰好是自由度的另一参数ñ - pE(X)L||XPX||2χ2σ2np

这些事实的证明简述如下。这两个结果对于基于正态分布的统计理论的进一步发展至关重要。还要注意,这就是为什么 -配送有它的参数化。这也是一个Γ -配送与尺度参数2 σ 2和形状参数ñ - p / 2,但在上述范围内是很自然的自由度的观点出发,以参数化。χ2Γ2σ2(np)/2

我必须承认,我没有发现Wikipedia文章中引用的任何段落特别有启发性,但是它们也不是真正错误或矛盾的。他们说的是一种不精确的笼统意义上的意义,即当我们计算方差参数的估计值时,但基于残差,我们将计算基于仅在维度的空间中自由变化的向量上- pnp

除了线性法线模型的理论之外,使用自由度的概念可能会造成混淆。这是,例如,在的参数化使用 -配送是否有对任何可能有任何自由度的参考。当我们考虑对分类数据进行统计分析时,对于应该在制表之前还是之后应该对“独立件”进行计数可能会有一些混淆。而且,对于不是子空间约束的约束,甚至对于普通模型,如何扩展自由度的概念也不是很明显。通常以有效自由度的名义存在各种建议。χ2

在考虑自由度的任何其他用法和含义之前,我强烈建议您在线性法线模型的背景下对此充满信心。处理此类模型的参考文献是“线性模型理论的第一门课程”,在本书的序言中还有其他有关线性模型的经典书籍的参考。

上述结果证明:,注意方差矩阵是σ 2和选择的标准正交基Ž 1... ž p大号和一个正交基Ž p + 1... ž Ñ大号。那么z 1z nR n的正交基。让Xξ=E(X)σ2Iz1,,zpLzp+1,,znLz1,,znRnX~表示在此基础上的系数的向量,即 也可以写成,其中是具有列中的。然后,我们必须使用是均值为正态分布和,因为是正交的,方差矩阵。这来自于正态分布的一般线性变换结果。被选择的基础上,使得系数被为X X = ž Ť X X = ž Ť X Ž ž X Ž Ť ξ Ž σ 2P X X= 1 ... p X - P X X= p + 1 ... Ñ P X = pnX

X~i=ziTX.
X~=ZTXZziX~ZTξZσ2IPXX~ii=1,,p,和的系数被为。由于这些系数不相关且共同为正态,因此它们是独立的,这意味着 和 是独立的。此外, 如果则因为因为因此。在这种情况下是的总和XPXX~ii=p+1,,nX-PX= Ñ Σ=p+1Xž| | XPX| | 2= Ñ Σ=p+1X 2 ξ&Element;大号
PX=i=1pX~izi
XPX=i=p+1nX~izi
||XPX||2=i=p+1nX~i2.
ξL= p + 1 ... Ñ ž 大号 ž ξ | | X P X | | 2 n p N 0E(X~i)=ziTξ=0i=p+1,,nziLziξ||XPX||2np独立分布的随机变量,根据定义,其分布是具有比例参数和自由度的分布。χ 2 σ 2 Ñ - pN(0,σ2)χ2σ2np

NRH,谢谢!(1)为什么必须在?(2)为什么和是独立的?(3)是否在确定性情况下根据自由度定义了随机变量上下文中的自由度?例如,具有自由度 原因是因为当是确定性变量而不是随机变量时,它是真的吗?(4)是否有与您的观点相同/相似的参考文献(书籍,​​论文或链接)?L P X X - P X | | X P X | | 2 n p XE(X)LPXXPX||XPX||2npX
蒂姆(Tim)

@ Tim,和是独立的,因为它们是正常且不相关的。X P XPXXPX
mpiktas 2011年

@Tim,我对答案做了一些改写,并提供了所陈述结果的证明。均值必须在以证明关于的结果。这是一个模型假设。在文献中,您应该寻找线性法线模型或一般线性模型,但是现在我只能回想一些未发布的老讲义。我将看看是否可以找到合适的参考。χ 2Lχ2
NRH

很棒的答案。感谢您的见解。一个问题:我不知道您所说的“平均矢量在 ” 是什么意思。你可以解释吗?您是否尝试定义?定义?还有什么吗 也许这句话对我来说做得太多或太简洁。您能否在提到的上下文中详细说明的定义:仅仅是吗?您能否详细说明在这种情况下(正常iid坐标)的是什么?只是吗?LEXLL E E x 1x 2x n= x 1 + x 2 + + x n/ n L L = RELEE(x1,x2,,xn)=(x1+x2++xn)/nLL=R
DW

@DW是期望运算符。因此,是的coordinatewise预期矢量。子空间是任何维子空间。它是向量的空间,当然不是,但是它很可能是一维的。最简单的示例可能是当 -vector跨所有坐标都为1时。这是具有相同平均值的的所有坐标的模型,但是更复杂的模型也是可能的。E X X L p R n n R 1 n XEE(X)XLpRnnR1nX
NRH

30

实际上,“自由度”一词在任何其他领域的工作方式都没有什么不同。例如,假设您有四个变量:矩形的长度,宽度,面积和周长。你真的知道四件事吗?不,因为只有两个自由度。如果知道长度和宽度,则可以得出面积和周长。如果知道长度和面积,则可以得出宽度和周长。如果知道面积和周长,则可以得出长度和宽度(直到旋转)。如果全部四个,则可以说系统是一致的(所有变量彼此一致),也可以不一致(没有矩形实际上可以满足所有条件)。正方形是去除了自由度的矩形。

在统计数据中,事情变得更加模糊,但是想法仍然相同。如果您要用作函数输入的所有数据都是自变量,那么您拥有的自由度与输入的一样多。但是,如果它们以某种方式具有依赖性,那么如果您有n-k个输入,则可以算出剩余的k个,那么实际上您只有n-k个自由度。有时您需要考虑到这一点,以免让您相信自己的数据比实际拥有的独立数据量更多的数据点,从而比实际数据更可靠或更具有预测能力。

(摘自http://www.reddit.com/r/math/comments/9qbut/could_someone_explain_to_me_what_degrees_of/c0dxtbq?context=3上的帖子。)

而且,这三个定义几乎都试图传达相同的信息。


1
基本上是正确的,但是我担心中间段落的读取方式会混淆相关性,(随机变量的)独立性和功能独立性(多个参数)。保持关联独立性的区别特别重要。
ub

@whuber:现在还好吗?
Biostat 2011年

3
没错,但是它使用术语的方式可能会使某些人感到困惑。它仍然没有明确区分随机变量和功能依赖。例如,具有非零相关性的(非简并)双变量正态分布中的两个变量将是相关的(作为随机变量),但它们仍提供两个自由度。

5
这是我在2009年发表的reddit帖子中粘贴的内容。
hobbs

2
我们的帮助中心提供了有关如何参考其他人撰写的材料的清晰指南,因此我希望OP可以回到此职位以采取适当的措施并进行建设性的互动(不过,我们已经有一段时间没有见到他了)。
chl 2014年

19

我真的很喜欢《统计实践小手册》的第一句话 。自由度章节

讲师最不喜欢数学的听众最担心的问题之一是:“自由度到底是什么?”

我认为通过阅读本章,您可以对自由度有很好的理解。


6
解释一下为什么自由度很重要,而不是仅仅如此,这将是很好的。例如,表明使用1 / n的方差估计是有偏差的,但是使用1 /(n-1)会产生无偏的估计量。
特里斯坦

9

维基百科断言自由度一个的随机矢量可以被解释为向量的子空间的尺寸。我想逐步进行,非常基本地将其作为Wikipedia条目的部分答案和详细说明。

提出的示例是对应于针对不同对象的连续变量的测量值的随机矢量的示例,表示为从原点扩展的矢量。它在矢量上的正交投影导致矢量等于测量工具的矢量投影(),即,点缀有向量此投影到子空间上的向量为一个有。该残余矢量(从平均距离)是最小二乘投影到 [ 1[abc]T[111]Tx¯=1/3(a+b+c)[x¯x¯x¯]T1[111]T1degree of freedom(n1)此子空间的三维正交补数,并且具有,是矢量分量的总数(在我们的情况下为因为我们在中可以通过获得与之间的差和:n1degrees of freedomn3R3[x¯x¯x¯]T[abc]T[x¯x¯x¯]T

[x¯x¯x¯][ax¯bx¯cx¯]=

=[(a+b+c)3(a(a+b+c)3)]+[(a+b+c)3(b(a+b+c)3)]+[(a+b+c)3(c(a+b+c)3)]

=(a+b+c)3[(a(a+b+c)3)+(b(a+b+c)3)+(c(a+b+c)3)]

=(a+b+c)3[13(3a(a+b+c)+3b(a+b+c)+3c(a+b+c))]

=(a+b+c)3[13(3a3a+3b3b+3c3c)]=0

并且此关系扩展到与正交的平面中的任何点 。在理解为什么此概念很重要,这是推导t分布(此处此处)的步骤。[x¯x¯x¯]T1σ2((X1X¯)2++(XnX¯)2)χn12

让我们取,对应于三个观测值。平均值是,并且矢量是正常(垂直)的平面,。将点坐标插入平面方程。[355080]T55[555555]T55x+55y+55z=DD=9075

现在我们可以选择该平面上的任何其他点,其坐标的平均值将为,在几何上与其在矢量上的投影相对应。因此,对于每个平均值(在我们的示例中为),我们都可以不受限制地在选择无数坐标();但是,由于该平面位于 ,因此第三个坐标将由该平面的方程式确定(或者将点在上的正交投影以几何方式。55[111]T55R22degrees of freedomR3[555555]T

这是正交于(箭头)的平面(天蓝色)上的三个点(白色)的表示:,和都在平面上(带有子空间) ,然后以其分量的均值为以及与(具有子空间)正交投影等于:[555555]T[355080]T[80805][901560]2df55[111]T1df[555555]T


9

在我的课堂上,我使用一种“简单”的情况,这可能会帮助您感到疑惑,甚至可能对自由度的含义产生直觉。

这是对主题的一种“阿甘正传”方法,但值得尝试。

假设您有10个独立观察值,它们来自均值和方差未知的正常人群。X1,X2,,X10N(μ,σ2)μσ2

您的观察为您带来了有关和。毕竟,您的观测值倾向于散布在一个中心值附近,该值应该接近的实际值和未知值,并且同样,如果非常高或非常低,那么您可以期望看到自己的观测值分别收集一个非常高或非常低的值。一个很好的“替代品”为(在没有实际价值的知识)是,您观察到的平均值。 μσ2μμμX¯

另外,如果您的观察值彼此非常接近,则表明您可以预期必须很小,并且同样地,如果非常大,那么您可以期望看到截然不同的值为到。 σ2σ2X1X10

如果您下注一周的工资应为和的实际值,则需要选择一对值来押注您的钱。除非您正确猜出直到小数点后第200位,否则不要想像丢掉薪水那样剧烈的事情。不。让我们考虑某种奖赏制度,您越猜和,您得到的奖励就越多。μσ2μμσ2

从某种意义上说,你的更好,更明智,和更有礼貌猜测的价值可。在这个意义上,你估计是必须围绕一些价值。类似地,一个好的 “替代品” (目前不需要)是,即样本方差,它很好地估计了。μX¯μX¯σ2S2σ

如果您认为这些替代物是和的实际值,那么您可能会错,因为很幸运的机会太渺茫了,以至于您的观察使自己协调起来就可以得到的礼物。等于,等于。不,可能没有发生。μσ2X¯μS2σ2

但是您可能会遇到不同程度的错误,从有点错误到真的,真的,真的非常糟糕的错误(又称“再见,薪水;下周见!”)。

好的,假设您使用作为的猜测。仅考虑两种情况:和。首先,您的观察结果非常漂亮且彼此接近。在后者中,您的观察结果差异很大。在哪种情况下,您应该更担心自己的潜在损失?如果您想到第二个,那是对的。估计会非常合理地改变您对下注的信心,因为越大,您可以预期的变化范围就越大。X¯μS2=2S2=20,000,000σ2σ2X¯

但是,除了关于和,您的观察还带有一定数量的纯随机波动,既没有关于也没有关于。 μσ2μσ2

你怎么注意到它?

好吧,为了争辩,我们假设有一个上帝,并且他有足够的空闲时间来给自己一个浮现的微妙之处,即可以特别地告诉您和的真实(至今未知)值。μσ

这是这个麦角酒故事的烦人的情节转折:您下注后,他会告诉您。也许启发你,也许准备你,也许嘲笑你。你怎么知道

好吧,这使得您的观察中包含的有关和的信息现在变得毫无用处。您的观测值的中心位置和方差不再有助于接近和的实际值,因为您已经知道它们了。μσ2X¯S2μσ2

与上帝良好相识的好处之一是,您实际上知道使用未能正确猜测多少,也就是您的估计误差。μX¯(X¯μ)

好吧,由于,然后(如果可以的话请相信我),还有(好的,也请相信我),最后, (猜猜是什么?也相信我),它绝对不包含有关或。ˉ XÑ μ σ 2XiN(μ,σ2)X¯N(μ,σ2/10)(X¯μ)N(0,σ2/10)

X¯μσ/10N(0,1)
μσ2

你知道吗?如果您将任何单个观测值用作的猜测,则估计误差将分配为。好吧,在用和任何估计之间,选择会更好,因为,所以与单独的相比,不太容易被误入歧途。μ(Xiμ)N(0,σ2)μX¯XiX¯Var(X¯)=σ2/10<σ2=Var(Xi)X¯μXi

无论如何,也绝对不是或。(Xiμ)/σN(0,1)μσ2

“这个故事会永远终结吗?” 你可能在想。您可能还会想:“是否还有更多关于和随机波动?”。μσ2

[我更倾向于认为您正在考虑后者。]

就在这里!

您的估计误差为方形与除以, 具有卡方分布,即标准正态的平方的分布,我敢肯定您注意到它绝对没有有关或信息,但传达了有关您应该面对的可变性的信息。μXiσ

(Xiμ)2σ2=(Xiμσ)2χ2
Z2ZN(0,1)μσ2

这是一个众所周知的分布,自然而然地产生于您对十个观测值中的每个观测值都存在赌博问题的情形,也源自您的平均值: 以及从您的十个观测值的变化集合: 现在,最后一个人没有卡方分布,因为他是这些卡方分布中十个的总和,它们彼此独立(因为

(X¯μ)2σ2/10=(X¯μσ/10)2=(N(0,1))2χ2
i=110(Xiμ)2σ2/10=i=110(Xiμσ/10)2=i=110(N(0,1))2=i=110χ2.
X1,,X10)。这些单一的卡方分布中的每一个都是对您应该面对的随机变异量的一种贡献,对总和的贡献量大致相同。

每个贡献的值在数学上都不等于其他九个,但是它们在分配中的预期行为都相同。从这个意义上讲,它们是对称的。

这些卡方中的每一个都是对您应该期望的纯随机变化量的一个贡献。

如果您有100个观测值,则上述总和可能会更大,因为它有更多的对接源

具有相同行为的每个“贡献源”都可以称为自由度

现在退后一两步,如果需要,请重新阅读前面的段落,以适应您所追求的自由度的突然到达。

是的,每个自由度都可以认为是一个必然发生的可变性单位,不会对或的猜测带来任何改善。μσ2

问题是,您开始依靠这10个等效的可变性来源的行为。如果您有100个观察值,那么您将有100个独立的,行为相同且严格随机波动的来源。

从现在起,这10个卡方的总和称为具有10个自由度的卡方分布,并写为。我们可以描述它从概率密度函数开始可以期望的结果,可以从数学上从那个单一卡方分布的密度数学得出(从现在起,具有一个自由度的方分布,写为),可以从正态分布的密度上算出。χ102χ12

“所以呢?” ---您可能在想---“只有当上帝花时间告诉我他可以告诉我的所有内容中和的值时,这才有好处!”μσ2

确实,如果全能神忙于告诉您和,您仍将拥有10个来源和10个自由度。μσ2

当您背叛上帝并尝试自己独自相处时,事情开始变得怪异(哈哈哈哈;仅现在!),而没想到他会光顾您。

您有和,和估计量。您可以找到更安全的选择。X¯S2μσ2

你可以考虑计算上面的总和和中的地方和: 但这就是与原始金额不同。X¯S2μσ2

i=110(XiX¯)2S2/10=i=110(XiX¯S/10)2,

“为什么不?” 两个和的平方内的术语非常不同。例如,您的所有观察结果最终都不可能大于,但在这种情况下,这意味着,但,因为。 μ(Xiμ)>0i=110(Xiμ)>0i=110(XiX¯)=0i=110Xi10X¯=10X¯10X¯=0

更糟糕的是,您可以轻松地(哈哈哈哈;对!)证明至少两个观察值不同时,具有严格的不等式(这很正常)。i=110(XiX¯)2i=110(Xiμ)2

“但是等等!还有更多!” 没有标准正态分布, 没有具有一自由度 卡方分布不具有卡方分布10自由度 没有标准正态分布。

XiX¯S/10
(XiX¯)2S2/10
i=110(XiX¯)2S2/10
X¯μS/10

“这一切都没有吗?”

没门。魔法来了!请注意 或等效地

i=110(XiX¯)2σ2=i=110[Xiμ+μX¯]2σ2=i=110[(Xiμ)(X¯μ)]2σ2=i=110(Xiμ)22(Xiμ)(X¯μ)+(X¯μ)2σ2=i=110(Xiμ)2(X¯μ)2σ2=i=110(Xiμ)2σ2i=110(X¯μ)2σ2=i=110(Xiμ)2σ210(X¯μ)2σ2=i=110(Xiμ)2σ2(X¯μ)2σ2/10
i=110(Xiμ)2σ2=i=110(XiX¯)2σ2+(X¯μ)2σ2/10.
现在我们回到那些已知的面孔。

第一项具有自由度为10的卡方分布,最后一项具有自由度为(!)的卡方分布。

我们将具有10个独立的均等行为的可变性源的卡方简单地分为两个部分,两个都是正数:一个部分是具有一个可变性源的卡方,而另一部分可以证明(信念飞跃? )也是具有9(= 10-1)个独立的均等行为变异性源的卡方,两个部分彼此独立。

这已经是一个好消息,因为现在有了它的发行。

las,它使用,我们无法访问它(回想起上帝在看着我们的斗争时在逗他开心)。σ2

好吧, 所以 因此 它不是标准正态分布,但其密度可以从标准法线和卡方的密度为自由度。

S2=1101i=110(XiX¯)2,
i=110(XiX¯)2σ2=i=110(XiX¯)2σ2=(101)S2σ2χ(101)2
X¯μS/10=X¯μσ/10Sσ=X¯μσ/10S2σ2=X¯μσ/10(101)S2σ2(101)=N(0,1)χ(101)2(101),
(101)

一个非常非常聪明的人在20世纪初进行了数学运算[^ 1],并且出于意料之外的结果,他使他的老板成为了烈性黑啤酒行业的绝对世界领导者。我说的是William Sealy Gosset(又名Student;是的,来自分布的那个学生)和Saint James's Gate Brewery(又名Guinness Brewery),我是虔诚的。t

[^ 1]:@whuber在下面的评论中告诉Gosset没有做数学运算,而是猜测!我真的不知道那个时候哪个壮举更令人惊讶。

亲爱的朋友,那是自由度为的分布的起源。标准法线与独立卡方的平方根之比除以其自由度,在无法预测的潮汐图中,最终将描述您在使用样本均值时遇到的估计误差的预期行为估计并使用估计的变异性。t(101)X¯μS2X¯

妳去 地毯后面隐藏着大量的技术细节,但不仅仅依靠上帝的干预来危险地押注您的全部薪水。


1
谢谢您的努力!我承认,我发现您的解释不那么令人信服。创始人似乎在这个关键的交界处说:“具有相同行为的那些“贡献来源”中的每一个都可以称为自由度。” 如果取而代之的是求和独立正态变量而不是独立卡方变量,则最终将得到一个正态变量。不知何故,“自由度”被完全吞噬了。显然,您尚未描述卡方的一些特殊之处。顺便说一句,戈塞特没有做数学:他猜对了!1010
Whuber

非常感谢您的评价,@ whuber!一旦您忘记了所写的内容,就会弹出许多错别字,这真是令人惊讶。关于您的评估,我只是想说明另一种思维方式-从某种意义上讲少了一些数学运算。另外,我并没有完全理解您的意思。如果您将10个独立的正态变量求和而不是10个独立的卡方变量求和,那么您最终将得到一个正态变量,我猜想这是您掌握的关键点。我将尝试对此进行详细说明,以期改善帖子。
马塞洛·文图拉

2

自由度的直观解释是它们代表 数据中可用的独立信息条数,这些信息可用于估计感兴趣的参数(即未知量)

例如,在以下形式的简单线性回归模型中:

Yi=β0+β1Xi+ϵi,i=1,,n

其中表示独立的正态分布误差项,均值为0,标准偏差为,我们使用1个自由度来估计截距并使用1个自由度来估计斜率。由于我们从观察开始,用尽了2个自由度(即,两个独立的信息),因此我们剩下个自由度(即,独立的信息)可用于估计误差。标准差。ϵiσβ0β1nn2n2σ


非常感谢您对我的答案@COOLSerdash所做的编辑!
Isabella Ghement

2

您可以将自由度视为观察数减去这些观察之间必要的关系数。例如,如果您有个独立的正态分布观测值。随机变量,其中。这里的自由度为因为它们是这些观察之间的必要关系。nX1,,Xni=1n(XiX¯n)2Xn12X¯n=1ni=1nXin1(X¯n=1ni=1nXi)

欲了解更多信息,请参阅


0

对我来说,我理解的第一个解释是:

如果您知道诸如均值或方差之类的统计值,那么在知道每个变量的值之前需要知道多少个数据变量?

这与aL3xa所说的相同,但是没有给任何数据点一个特殊的角色,并且接近答案中给出的第三种情况。这样,相同的示例将是:

如果您知道数据的平均值,则需要知道除一个数据点以外的所有数据的值,以了解所有数据点的值。


变量->观察
理查德·哈迪

0

这样想吧。独立时方差是加性的。例如,假设我们在板上扔飞镖,并且我们测量了和位移与板确切中心的标准偏差。然后。但是,如果我们取公式的平方根,则,我们得到正交坐标的距离公式。现在,我们所要显示的是,标准偏差是代表离开飞镖板中心的位移的代表性度量。由于,我们已经有了讨论df的现成方法。注意当xyVx,y=Vx+VyVx=SDx2Vx,ySDx,y=SDx2+SDy2SDx=i=1n(xix¯)2n1n=1,则,比率。换句话说,一个飞镖的与其自身之间没有偏差。我们第一次有偏差是针对,只有一个是重复项。该重复偏差是或与之间的平方距离,因为是与之间的中点或平均值。通常,对于距离,我们删除1,因为取决于所有x1x¯=0 XÑ=2X1X2 ˉ X =X1+X2i=1n(xix¯)2n100xn=2x1x2 ˉ X X1X2Ñ ˉ X ññ-1x¯=x1+x22x¯x1x2nx¯n这些距离中的。现在,代表自由度,因为它对唯一结果的数量进行了归一化以形成预期的平方距离。分为那些平方距离的总和。n1

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.