您如何用外行的术语解释矩生成函数(MGF)?


15

什么是矩产生函数(MGF)?

您能以通俗易懂的方式以及一个简单的示例来解释它吗?

请尽量限制使用正式的数学符号。


1
您想要一个简单,简单的示例...但是没有数学符号吗?我不确定这样的事情是否会很容易做到-至少要冒冒给您所处理内容产生误导性印象的风险。我想可以给退化的随机变量的mgf提供一个总是为的退化随机变量,而无需太多的数学表示法,但是如果您真的想了解mgfs,那将是毫无启发的。0
Glen_b-恢复莫妮卡

1
我不确定是否有一种直观的理解方式,您可能只是将其视为“编码”发行版的一种方式(至少在存在时,这种想法在特性函数中会更好一些)。
dsaxton

1
矩生成函数(如果存在)是一种将随机变量的所有非负整数矩编码为一个函数的方法,可以从中再次提取它们。mgfs可用于执行某些特定的计算,而这些计算有时用其他方式并不那么容易。我希望不会有太大帮助。
Glen_b-恢复莫妮卡

1
我确定您已经看到Joe Blitztein 在Quora上
Antoni Parellada

Answers:


18

让我们假设没有方程式的直觉是不可能的,并且仍然坚持将数学精简到非常本质,以了解正在发生的事情:我们正在尝试获取统计矩,在必须参考物理学之后,我们将其定义为随机变量功效的期望值。对于连续随机变量,原始的第矩是LOTUSk

(1)E[Xk]=Xkpdfdx

时刻生成函数,是一个去这积分(公式1)走动通过,相反,执行:

MX(t):=E[etX],

(2)E[etX]=etXpdfdx

为什么?因为它更容易并且存在可以通过扩展可以看出,MGF的一个梦幻般的财产麦克劳林系列etX

etX=1+X1!t+X22!t2+X33!t3+

考虑到此幂级数的两个方面的期望:

MX(t)=E[etX](3)=1+E[X]1!t+E[X2]2!t2+E[X3]3!t3+

矩在此多项式“晾衣绳”上显示为“栖息”,可以通过简单地将次微分并在所有时刻经过一次较容易的积分(在等式(2)中)一次评估为零来剔除当pdf是指数时,最容易集成的事实是最明显的。k

要恢复第个矩:k

MX(k)(0)=dkdtkMX(t)|t=0

最终需要区分的事实使它不是免费的午餐-最终,它是pdf 的双向Laplace变换,其指数变化了:

L{pdf(x)}(s)=esxpdf(x)dx

这样

(4)MX(t)=L{pdf(x)}(s).

实际上,这为我们提供了直觉的物理途径。拉普拉斯变换作用在并将其分解为瞬间。傅里叶变换相似性是不可避免的:FT将函数映射到实线上的新函数,而Laplace将函数映射到复平面上的新函数。傅立叶变换将一个函数或信号表达为一系列频率,而拉普拉斯变换将一个函数解析为其。实际上,获得力矩的另一种方法是通过傅立叶变换(特征函数)。拉普拉斯变换中的指数项通常为其中pdfe s t s = σ + iests=σ+iω,对应于真实指数和虚正弦信号,以及诸如屈服重复


[ 摘自Steven W. Smith的科学家和工程师信号处理指南 ]


因此,当时,函数以某种方式将分解为其“组成频率”从等式 (4):MX(t)pdfσ=0.

MX(t)=E[esX]=esxpdf(x)dx=e(σ+iω)xpdf(x)dx=eσxeiωxpdf(x)dx

这就给我们留下了用红色表示的那一部分表达式的不正确积分,对应于pdf的Fourier变换。

通常,函数的拉普拉斯变换极点直觉是它们会提供函数的指数(衰减)和频率分量的信息(在本例中为pdf)。


为了回应评论中有关从切换到,这是一个完全具有战略意义的举措:一个表达式不能接follow而来。打个比方:我们拥有自己的汽车,每当需要处理一些事务时,我们都可以自由驶入城市(阅读,对等式积分,无论在每个单独的瞬间有多么艰难) 。相反,我们可以做一些完全不同的事情:我们可以开车到最近的地铁站(阅读,只需解一次方程),然后从那里乘坐公共交通工具到达我们需要参观的每个地方(阅读,得到等式中的积分的导数以提取Xketx(1)(2)k(2)k-我们需要的第一个时刻,知道了(由于等式),所有时刻都“藏在”那里,并通过评估为隔离)。(3)0


2
如何取代?(E[etX]E[Xk]
出乎意料

2
我希望能理解这个答案的外行是我的学生:)
阿克萨卡尔州

3

用大多数外行术语来说,这是一种将概率分布的所有特征编码为一个简短短语的方法。例如,如果我知道分布的MGF为 我可以通过采用泰勒展开的第一项来找出该分布的均值: 如果您知道自己在做什么,那比期望值要快得多概率函数。

M(t)=etμ+1/2σ2t2
ddtM(t)|t=0=μ+σ2t|t=0=μ

而且,由于此MGF编码了有关发行版的所有内容,因此,如果您知道如何操作该函数,则可以一次对发行版的所有特征进行操作!为什么我们不总是使用MGF?首先,并非在所有情况下MGF都是最简单的工具。其次,MGF并不总是存在。

外行之上

假设您具有标准正态分布。您可以通过陈述其PDF来表达您所知道的一切:

f(x)=12πex2/2

您可以计算其矩,例如平均值和标准偏差,并将其用于变换后的变量和随机法线等上的函数。

您可以将正态分布的MGF视为PDF的替代方案。它包含相同数量的信息。我已经展示了如何获得均值。

为什么我们需要替代方法?如我所写,有时只是更方便。例如,尝试从PDF计算标准法线的方差: 并不是那么困难,但是使用MGF轻松得多:

σ2=x212πex2/2dx=?
M(t)=et2/2
σ2=d2dt2M(t)|t=0=ddtt|t=0=1


1
您能否扩展一下它对分布进行编码的“所有内容”?
ColorStatistics

2
要欣赏@ColorStatistics提出的观点,请参阅stats.stackexchange.com/questions/25010
ub

@whuber:谢谢你,胡布。我将研究该参考。这是我希望更好地理解的主题。
ColorStatistics

我们如何证明MGF和PDF包含相同数量的信息?
Aerin
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.