概率分布的“矩”又是什么“矩”?


65

我知道什么是矩,如何计算矩,以及如何使用矩生成函数获取高阶矩。是的,我知道数学。

现在,我需要润滑工作中的统计知识,我想我也应该问这个问题-困扰我大约几年了,回到大学后,没有教授知道答案,或者只是拒绝回答这个问题(诚实地) 。

那么“矩”一词在这种情况下是什么意思?为什么选择这个词?对我来说,这听起来不直观(或者我从没在大学时就这么听过:)想到它,我同样对它在“惯性矩”中的用法感到好奇;)但让我们暂时不关注它。

因此,分布的“时刻”是什么意思,它试图做什么,以及为什么要这样说!:)为什么有人在乎时刻?在这一刻,我对那一刻感到不舒服;)

PS:是的,我可能也曾问过类似的方差问题,但我确实很重视直观的理解,而不是“在书中查找以找出问题” :)


5
对于单词选择,请从其词源入手。

2
@whuber:是的!在提出这个问题之前先查过-很多年前;)
博士

我将结合@whuber提供的词源学(thefreedictionary.com/moment),看看Collins English Dictionary中引用的Math / Stat定义。将其与常用定义(例如“短时间段”或“特定实例”)结合起来。我相当确定在我们的数学/统计意义上的时刻可以与点互换。在笛卡尔的几何和代数没有系统的联系之前,仅这些点在某些应用程序(MGF或MOI)中具有特殊意义,因此它们对于实际上相同的事物可能具有各种不同的术语。
克里斯·西莫卡特

4
来自麦克白:“ 谁能在瞬间使人变得聪明,惊讶,温和,愤怒,忠诚和中立? ”麦克白:第二幕。Sc。3
狼人2014年

Answers:


62

根据HA David 的论文“数理统计中常见的第一个(?)出现”,在这种情况下首次使用“矩”一词是在1893年卡尔·皮尔森给自然的一封信中,题为“非对称频率曲线”

内曼(Neyman)在1938年发表的Biometrika论文“关于卡尔·皮尔逊(Karl Pearson)推导二项式矩的历史笔记”很好地概括了这封信以及皮尔森(Pearson)随后关于二项式分布矩和矩量方法的工作。这真是一本好书。希望您可以访问JSTOR,因为我现在没有时间对论文进行很好的总结(尽管我本周末会)。尽管我会提到一篇文章,该文章可能对为什么使用“时刻”一词有所启发。根据内曼的论文:

[Pearson的回忆录]主要涉及通过一些涉及简单公式计算的过程来逼近连续频率曲线的方法。考虑的这些公式之一是“点二项式”或“带坐标的二项式”。该公式
不同于我们今天所说的二项式,即。(4)仅用因数 表示连续曲线下要拟合的面积。α

这最终导致了“时刻方法”。内曼(Neyman)在上述论文中讨论了皮尔逊对二项式矩的推导。

从皮尔森的信中:

现在,我们将开始寻找圆形GN矩形系统的前四个矩。如果每个矩形的惯性都可以看作是沿其垂直中线集中的,那么对于NG 的矩,我们应该写成。sthd=c(1+nq)

这暗示了皮尔逊使用“矩”一词作为对“惯性矩”的暗示的事实,惯性矩是物理学中的常用术语。

这是培生的《自然》大部分信件的扫描:

在此处输入图片说明

在此处输入图片说明

您可以在此处在615页查看整个文章。


1
我可以给这个答案+100吗?;)
博士

5
@Nupul,您可以提供+100的赏金。如果问题持续两天,就可以颁发赏金。
mpiktas 2011年

4
@Nupul观察皮尔逊对“引力”的多次引用。显然他是在用生理上的比喻来推理。这将问题推回到了物理学为什么对此类事物使用术语“矩”的原因。我相信这只是惯性矩(第二矩)这一思想的自然概括,您可以在词源学链接中找到“矩”。 就是词源相关的原因。
Whuber

4
物理学认识到比第二个矩Nupul高的矩,并且公式与统计公式相同。人们仅将对象的“密度”转换为“概率密度”。实际上,物理学将这一思想概括为:矩是在某个适当坐标系中的幂级数展开系数
ub

3
@Nupul我不知道我是否可以添加除whuber所说的以外的任何内容。我认为,除了我在回应和胡布尔的评论中所链接的内容之外,所有其他内容都可以在Physics SE中得到更彻底的解决。而且,如果仍然不够“深入”,那么总会有英语SE的第五个最常用的标签是“词源”。但是,很好的问题!喜欢研究它,发现了3篇我不知道的伟大论文。

7

每个人都有自己的时刻。我拥有Cumulant的名字,以及矩值,方差,偏度和峰度之外的名字,并花了一些时间阅读这个华丽的话题。

奇怪的是,我在《 HA David的论文》中找不到“一时的提及”。于是,我去看 了TM Porter的著作《卡尔·皮尔森:统计时代的科学生活》,以及卡尔·皮尔森与《现代统计的起源:弹性论》。成为统计学家,例如编辑了“弹性理论和材料强度史”(从伽利略到当今)

他的背景非常广泛,尤其是工程学和弹性学教授,他参与了确定桥梁跨度的弯矩和计算砌筑大坝的应力的工作。在弹性方面,人们只能以有限的方式观察正在发生的事情(破裂)。他似乎对(从波特的书中)感兴趣:

图形计算,或者以最庄重和数学的形式给出的图形静力学。

以后:

从他的统计职业生涯的开始,甚至在此之前,他都使用“时刻方法”来拟合曲线。在力学中,这意味着将一个复杂的物体与一个具有相同质心和“摆动半径”(分别是第一和第二力矩)的简单或抽象物体匹配。这些数量在统计上对应于平均值以及围绕平均值的测量值的散布或分散。

并且由于:

培生(Pearson)处理离散的测量间隔,这是一个总和而不是整数

惯性矩可以表示运动物体的摘要:可以像将物体简化为单个点一样进行计算。

皮尔逊将这五个等式设置为一个方程组,这些方程组合并为九分之一。数值解只能通过逐次逼近来实现。可能有多达九个实际解决方案,尽管在目前情况下只有两个。他将两个结果与原始图一起绘制,并对结果的外观感到总体满意。但是,他并不是依靠视觉检查来决定它们之间的匹配,而是计算出第六时刻来确定最佳匹配

让我们回到物理学。力矩是一种物理量,通常考虑到某个序数点或轴(通常在空间或时间上)时考虑到物理属性的局部排列。它总结了在距参考点一定距离处测得的物理量。如果数量未集中在单个点上,则通过积分或总和将力矩“平均”在整个空间中。

显然,力矩的概念可以追溯到阿基米德“发现”杠杆的工作原理的发现。最早出现的一个单词是拉丁语单词“ momentorum”,具有当前公认的含义(围绕旋转中心的力矩)。1565年,Federico Commandino将阿基米德的著作(Liber de Centro Gravitatis Solidorum)翻译为:

每个实体图形的重心就是其中的那个点,等力矩的所有侧面都围绕该点。

要么

约重心的无花果固形物,约无歧义的瞬间花粉

因此,显然,与物理学的类比非常强大:从复杂的离散物理形状中,找到足够近似的量(压缩或简约形式)。


6

由于过于简单,统计矩是曲线/分布的附加描述。我们熟悉前两个时刻,它们通常对于连续正态分布或类似曲线很有用。但是,这头两个时刻对于其他发行版失去了信息价值。因此,其他时刻提供了有关分布形状/形式的其他信息。


1
我不认为前两个时刻的含义对于所有非正态分布都失去意义,例如,平均停留时间通常是时间序列中的第一时刻或时间的整数平均值。
卡尔

5

问题:在这种情况下,“时刻”一词是什么意思?为什么选择这个词?对我来说,这听起来不直观(或者我从没在大学时就这么听过:)想到它,我同样对它在“惯性矩”中的用法感到好奇;)但让我们暂时不关注它。

答:实际上,从历史意义上讲,惯性矩可能是“矩”一词的含义所在。确实,可以(如下所示)表明惯性矩与方差的关系。这也产生了更高力矩的物理解释。

在物理学中,力矩是一种包含距离与物理量的乘积的表达式,以此方式可以说明物理量是如何定位或布置的。力矩通常是相对于固定参考点定义的;它们处理在距该参考点一定距离处测得的物理量。例如,作用在物体上的力力矩(通常称为扭矩)是力与距参考点的距离的乘积,如下例所示。

在此处输入图片说明

比起通常给出名称,例如,对于较高力矩的超平坦度等,不那么容易混淆,这是刚体的圆周运动力矩,例如圆周运动的惯性矩。角加速度是角速度的导数,角速度是相对于时间的角导数,即。考虑到第二力矩类似于施加到圆周运动上的转矩,或者如果您要对该圆周进行加速/减速(也是二阶导数)(即角度,dωdt=α,dθdt=ωθ)运动。类似地,第三矩将是转矩的变化率,以此类推,对于更高的矩,依此类推,以使变化率的变化率随变化率变化,即圆周运动的顺序导数。通过实际示例可能更容易将其可视化。

物理上的合理性存在一定的局限性,例如,某个对象的开始和结束位置(即它的支持),使比较或多或少变得现实。让我们以Beta分布为例,该分布在[0,1]上具有(有限)支持,并显示该对应关系。Beta分布密度函数(pdf)为 其中和是伽马函数,。

β(x;α,β)={xα1(1x)β1B(α,β)0<x<10True,
B(α,β)=Γ(α)Γ(β)Γ(α+β)Γ(.)Γ(z)=0xz1exdx

均值然后旋转的一阶矩周围的 -轴的β函数绘制成具有最小面积均匀密度的刚性旋转薄片固定到(0,0,0)起源-值,以其碱在平面上。 如,即下面, zxx,y

μ=01rβ(r;α,β)dr=αα+β,
β(r;2,2)μ=12在此处输入图片说明

请注意,没有什么阻止我们将beta分布薄片移动到另一个位置并重新缩放,例如从为,或更改垂直形状,例如将其更改为桨而不是驼峰。0r12r4

要计算beta分布方差,我们将计算值平均值位于旋转轴上的 移动beta分布的惯性矩 其中,即,其中是惯性矩,看起来像这样,rz

σ2=01(rμ)2β(r;α,β)dr=αβ(α+β)2(α+β+1),
β(r;2,2)I=σ2=120I

在此处输入图片说明

现在,对于较高的所谓 “中心”矩,即关于平均值的矩,例如偏度和峰度,我们从计算围绕平均值的矩 这也可以理解为圆周运动的导数。1 0[R - μ ñ β ř ; α β nth n

01(rμ)nβ(r;α,β)dr.
nth

如果我们想向后计算,即获取3D实体对象并将其转换为概率函数怎么办?事情变得有些棘手。例如,让我们花一个圆环在此处输入图片说明

首先,我们取其圆形横截面,然后将其制成半椭圆形,以显示任何薄片状硬币的密度,然后将其转换为楔形硬币,以解决随着距离()的增加而密度增加的问题。从轴开始,最后我们对面积进行归一化以生成密度函数。下面以图形方式概述了数学,留给了读者。žrz

在此处输入图片说明

最后,我们问这些等价关系如何与运动相关?注意,如上所述,可以使惯性矩与第二中心矩 AKA(方差)有关。然后,,即转矩与角加速度。然后,我们将进行区分以获得更高的时间变化率。σ 2= τIσ2 τI=τaτa


力矩与导数之间的联系是模糊的。(它确实存在,但是通常通过傅立叶变换来揭示这种关系。)您能否明确说明如何以及为何将矩解释为导数?这是如何运作的?
whuber

@whuber之后,同时查看上面的时刻链接,它显示||。
卡尔,

谢谢。我看到了该页面,并且对您所指的内容有所了解,但是与发行时刻的联系尚不清楚。我很感兴趣,期待您进一步阐述这个想法。
ub

@whuber检查一下,看看是否同意。
卡尔,

2
是的,可以做到。当系列的自变量表示为您将获得一个傅立叶级数。此外,矩和导数之间的联系在傅里叶变换中是明确的:微分算子被转换为乘法,直接显示了矩如何与相同阶数的导数连接。X = ë q qxx=eiqq
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.