到底是什么时刻?它们是如何衍生的?


19

通常,我们通过“使总体矩等于其样本对等体”来介绍矩估计器的方法,直到我们估算出总体的所有参数为止。这样,在正态分布的情况下,我们只需要第一刻和第二刻,因为它们可以完全描述这种分布。

ËX=μ一世=1个ñX一世/ñ=X¯

ËX2=μ2+σ2一世=1个ñX一世2/ñ

从理论上讲,我们最多可以将额外时刻计算为:ñ

ËX[R一世=1个ñX一世[R/ñ

我该如何为真正的时刻建立直觉?我知道它们作为一个概念存在于物理学和数学中,但是我发现它们都不直接适用,特别是因为我不知道如何将抽象概念从质量概念扩展到数据点。该术语似乎在统计学中以特定方式使用,这与其他学科中的用法不同。

我的数据的什么特征决定了总共有多少()个力矩?[R


7
当应用于概率分布时,该术语的含义与物理相同。参见此处,它具有等式,“ 其中是电荷,质量或任何数量的密度的分布 ”。当“正在考虑的事物”是概率密度时,您具有相应的概率矩。这些都是原始时刻(关于原点的时刻)。相比之下...(ctd)ρμñ=[Rñρ[Rd[Rρ
Glen_b-莫妮卡

2
矩是诸如分位数之类的随机变量分布的参数化特征。力矩由自然数参数化,并完全表征分布(请参见力矩生成函数)。这并不排除对于某些分布可能在矩之间存在完全的功能依赖性,因此并非总是需要所有矩来表征分布。(1/2)
tchakravarty 2015年

矩在功能上取决于正态分布的前两个,因此前两个足以表征分布,包括均值和方差。(2/2)3
tchakravarty 2015年

5
(ctd)... 数学矩相同(),除了大约而不是0 (即只是物理学的一种广义形式,但是由于它们只是起源的改变而相同,所以物理学家会正确地说“那有什么不同?”)。当为密度时,这些概率相同。对我来说,三个人在说“时刻”时都在谈论同一件事,而不是不同的话。μñ=-X-CñFXdXCF
Glen_b-恢复莫妮卡

3
我敢肯定,您可以在已发布的许多有关瞬间和直觉的话题中找到答案。统计使用的力矩与物理和数学使用的力矩完全相同,它是在所有三个领域中具有相同定义的相同概念。
ub

Answers:


17

自从我上物理课以来已经很长时间了,所以让我知道这是否不正确。

物理类比矩的一般描述

采取随机变量Xc周围的第n个矩为: m nc = E [ X - c n ] 这正好对应于矩的物理意义。想象X是沿着实线的点的集合,其密度由pdf给出。在此线下方的c处放置一个支点,并开始计算相对于该支点的力矩,计算将完全对应于统计力矩。XnXc

mn(c)=E[(Xc)n]
Xc

大多数时候,该的第时刻X指的是围绕0的时刻(时刻其中支点放置在0): Ñ = ë [ X Ñ ]Ñ中央的时刻X Ñ = m nm 1= E [ X m 1 n ]nX

mn=E[Xn]
nX
m^n=mn(m1)=E[(Xm1)n]
这对应于支点位于质心的时刻,因此分布是平衡的。如下所述,它使时刻更易于解释。因为分布是平衡的,所以第一中心矩将始终为零。

标准化的时刻X是: Ñ = ÑnX 同样,它通过分布的扩展来缩放矩,从而可以更轻松地特别地解释峰度。第一个标准矩将始终为零,第二个标准矩将始终为1。这对应于变量的标准分数(z分数)的时刻。对于这个概念,我没有一个很好的物理模拟。

ñ=^ñ^2ñ=Ë[X-1个ñ]Ë[X-1个2]ñ

常用时刻

对于任何分布,可能都有无限数量的力矩。足够的时刻几乎总是可以完全表征和分布(为此确定必要的条件是时刻问题的一部分)。统计学中经常谈论四个时刻:

  1. 均值 -第一个矩(以零为中心)。它是分布的质心,或者它与分布相对于支点0的扭矩力矩成比例。
  2. X
  3. 偏度 -第三中心矩(有时是标准化的)。分布在一个方向或另一个方向上的偏差的量度。相对于正态分布(没有偏斜),正偏斜的分布具有极高结果的可能性低,负偏斜的分布具有极低的结果可能性。物理类似物很困难,但可以宽松地衡量分布的不对称性。例如,下图取自Wikipedia偏斜度,取自维基百科
  4. X峰度,也来自维基百科

我们很少谈论超越峰度的时刻,因为它们的直觉很少。这类似于物理学家在第二时刻之后停止。


6

这有点老了,但我想纠正Fg Nu的评论中的错误陈述,他写道:“矩由自然数参数化,并完全表征分布”。

片刻并不能完全代表分布。具体而言,即使存在所有无限数量的力矩,也不一定能唯一地确定分布。

根据我最喜欢的概率书,费勒“概率论及其应用第二卷简介”(请参阅​​我在常见分布的真实示例中的答案),在第227-228页的VII.3节示例中,对数正态不确定就其矩而言,意味着存在其他分布,其所有无限数量的矩都与对数正态相同,但分布函数不同。众所周知,矩对数生函数对于对数正态不存在,对于其他具有相同矩的分布也不存在。

X

ñ=1个Ë[X2ñ]-1个/2ñ

发散。注意,这不是一个if if only only。此条件对于对数法线不成立,实际上,它不是由其时刻决定的。

另一方面,共享所有无限数量矩的分布(随机变量)由于可以从它们的矩导出的不等式,只能相差很大。


当分布有界时,这将大大简化,在这种情况下,力矩始终完全(唯一)确定分布。
Alex R.

@Alex这是Feller引用的结果的直接结果。
whuber

说对数法线不存在矩生成函数并不完全正确。关于mgf的最有用的定理假设它存在于一个包含零的开放区间中,严格意义上说它不存在。但是它确实存在于从零发出的光线中,并且还提供了有用的信息。
kjetil b halvorsen '16

@ kjetil b halvorsen,您能描述从对数法线从零发出的对数法线的MGF的存在所获得的有用信息吗?那是什么射线?
Mark L.Stone

作为上述问题的意见,以凹凸@kjetil b Halvorsen的..
马克·劳伦斯斯通

2

Glen_b的说法的推论是,均值的第一矩对应于物理对象的重心,而均值周围的第二矩即方差对应于其惯性矩。之后,您就一个人了。


3
Ë[X2]=X2FXdX v一种[R[X]=Ë[X-Ë[X]2]=X-Ë[X]2FXdX

0

一个二叉树有两个分支,每个分支可能为0.5。实际上,p = 0.5,并且q = 1-0.5 = 0.5。这将生成具有均匀分布的概率质量的正态分布。

实际上,我们必须假设树中的每一层都是完整的。当我们将数据分解为bin时,我们从该部门获得了一个实数,但我们将其四舍五入。好吧,这是一个不完整的层,因此我们最终不会得到近似于正常值的直方图。

将分支概率更改为p = 0.9999和q = 0.0001,这使我们得到了偏斜的法线。概率质量发生了变化。这就是偏度的原因。

拥有不完整的层级或单元格小于2 ^ n的二叉树,其面积没有概率质量。这使我们出现峰度。


对评论的回应:

当我谈论确定箱数时,请四舍五入到下一个整数。

Quincunx机器掉落的球最终通过二项式近似于正态分布。这种机器做出了几个假设:1)箱数是有限的,2)底层树是二叉树,3)概率是固定的。纽约数学博物馆的Quincunx机器使用户可以动态更改概率。概率可以随时更改,甚至在当前层完成之前也可以。因此,这种关于垃圾箱未装满的想法。

当您在树上有空隙时,与我在原始答案中所说的不同,该分布显示出峰度。

我正在从生成系统的角度看待这个问题。我使用三角形来总结决策树。做出新的决定时,会在三角形的底部以及在分布的尾部添加更多的条带。从树上修剪子树会在分布的概率质量中留下空白。

我只回答给您直观的感觉。标签?我已经使用Excel并处理了二项式中的概率,并生成了预期的偏斜。对于峰度,我还没有这样做,当我们使用暗示运动的语言时,我们不得不将概率质量视为静态是没有帮助的。基础数据或球会导致峰度。然后,我们对其进行各种分析,并将其归因于形状描述性术语,例如中心,肩膀和尾巴。我们唯一需要使用的是垃圾箱。垃圾箱动态地生活,即使数据不能。


2
这很有趣,但是非常粗略。例如,二叉树上的标签是什么?如果要获得正态分布,最好是一棵无穷大的树-但是明显的标签(使用随机游走或使用实数的二进制表示)根本不会导致正态分布。没有这些细节,读者的想象力就会太多。您能详细说明一下吗?
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.