您如何用外行的术语解释矩生成函数（MGF）？

什么是矩产生函数（MGF）？

您能以通俗易懂的方式以及一个简单的示例来解释它吗？

请尽量限制使用正式的数学符号。

moments intuition mgf

— 用户名
source

您想要一个简单，简单的示例...但是没有数学符号吗？我不确定这样的事情是否会很容易做到-至少要冒冒给您所处理内容产生误导性印象的风险。我想可以给退化的随机变量的mgf提供一个总是为的退化随机变量，而无需太多的数学表示法，但是如果您真的想了解mgfs，那将是毫无启发的。

0

$0$

— Glen_b-恢复莫妮卡

我不确定是否有一种直观的理解方式，您可能只是将其视为“编码”发行版的一种方式（至少在存在时，这种想法在特性函数中会更好一些）。

— dsaxton

矩生成函数（如果存在）是一种将随机变量的所有非负整数矩编码为一个函数的方法，可以从中再次提取它们。mgfs可用于执行某些特定的计算，而这些计算有时用其他方式并不那么容易。我希望不会有太大帮助。

— Glen_b-恢复莫妮卡

我确定您已经看到Joe Blitztein 在Quora上

— Antoni Parellada

Answers:

让我们假设没有方程式的直觉是不可能的，并且仍然坚持将数学精简到非常本质，以了解正在发生的事情：我们正在尝试获取统计矩，在必须参考物理学之后，我们将其定义为随机变量功效的期望值。对于连续随机变量，原始的第矩是LOTUS： $k$

\begin{aligned} (1) & E [X^{k}] & = \int_{- \infty}^{\infty} X^{k} pdf d x \end{aligned}

$\begin{align}\large \color{red}{\mathbb{E}\left[{X^k}\right]} &= \displaystyle\int_{-\infty}^{\infty}\color{blue}{X^k}\,\,\color{green}{\text{pdf}}\,\,\,dx\tag{1}\end{align}$

的时刻生成函数，是一个去这积分（公式1）走动通过，相反，执行：

M_{X} (t) := E [e^{t X}],

$M_X(t):=\mathbb E\big[e^{tX}\big],$

\begin{aligned} (2) & E [e^{t X}] & = \int_{- \infty}^{\infty} e^{t X} pdf d x \end{aligned}

$\begin{align} \large \color{blue}{\mathbb{E}\left[e^{\,tX}\right]}&=\displaystyle \int_{-\infty}^{\infty}\color{blue}{e^{tX}}\,\color{green}{\text{pdf}}\, dx\tag{2}\end{align}$

为什么？因为它更容易并且存在可以通过扩展可以看出，MGF的一个梦幻般的财产麦克劳林系列的 $\color{blue}{e^{\,tX}}$

e^{t X} = 1 + \frac{X}{1!} t + \frac{X^{2}}{2!} t^{2} + \frac{X^{3}}{3!} t^{3} + \dots

$e^{tX}=1+\frac{ X }{1!}\, t +\frac{ X^{2} }{2!}t^{2} +\frac{ X^{3} }{3!} t^{3} +\cdots$

考虑到此幂级数的两个方面的期望：

\begin{aligned} M_{X} (t) & = E [e^{t X}] \\ (3) & = 1 + \frac{E [X]}{1!} t + \frac{E [X^{2}]}{2!} t^{2} + \frac{E [X^{3}]}{3!} t^{3} + \dots \end{aligned}

$\begin{align} M_X(t) &= \color{blue}{\mathbb{E}\left[e^{\,tX}\right]} \\[1.5ex] &=1 + \frac{\color{red}{\mathbb{E} \left[X\right]}}{1!} \, t \, + \frac{\color{red}{\mathbb{E} \left[X^2\right]}}{2!} \, t^2 \, + \frac{\color{red}{\mathbb{E} \left[X^3\right]}}{3!} \, t^3 \, + \cdots\tag{3} \end{align}$

矩在此多项式“晾衣绳”上显示为“栖息”，可以通过简单地将次微分并在所有时刻经过一次较容易的积分（在等式（2）中）一次评估为零来剔除！当pdf是指数时，最容易集成的事实是最明显的。 $k$

要恢复第个矩： $k$

M_{X}^{(k)} (0) = \frac{d^{k}}{d t^{k}} M_{X} (t) |_{t = 0}

$M_X^{(k)}(0)=\frac{d^k}{dt^k}M_X(t)\Bigr|_{t=0}$

最终需要区分的事实使它不是免费的午餐-最终，它是pdf 的双向Laplace变换，其指数变化了：

L {pdf (x)} (s) = \int_{- \infty}^{\infty} e^{- s x} pdf (x) d x

$\mathcal L \{\text{pdf}(x)\}(s) =\int_{-\infty}^{\infty}e^{-sx}\text{pdf}(x) dx$

这样

\begin{matrix} (4) & M_{X} (t) = L {pdf (x)} (- s) . \end{matrix}

$M_X(t)=\mathcal L\{\text{pdf}(x)\}(-s)\tag 4.$

实际上，这为我们提供了直觉的物理途径。拉普拉斯变换作用在并将其分解为瞬间。傅里叶变换的相似性是不可避免的：FT将函数映射到实线上的新函数，而Laplace将函数映射到复平面上的新函数。傅立叶变换将一个函数或信号表达为一系列频率，而拉普拉斯变换将一个函数解析为其矩。实际上，获得力矩的另一种方法是通过傅立叶变换（特征函数）。拉普拉斯变换中的指数项通常为其中 $\color{green}{\text{pdf}}$ $e^{-st}$ $s=\sigma + i\,\omega$ ，对应于真实指数和虚正弦信号，以及诸如屈服重复此：

[ 摘自Steven W. Smith的科学家和工程师信号处理指南 ]

因此，当时，函数以某种方式将分解为其“组成频率”从等式（4）： $M_X(t)$ $\text{pdf}$ $\sigma=0.$

\begin{aligned} M_{X} (t) & = E [e^{- s X}] \\ = \int_{- \infty}^{\infty} e^{- s x} pdf (x) d x \\ = \int_{- \infty}^{\infty} e^{- (σ + i ω) x} pdf (x) d x \\ = \int_{- \infty}^{\infty} e^{- σ x} e^{- i ω x} pdf (x) d x \end{aligned}

$\begin{align}\require{cancel} M_X(t)&=\mathbb E\big[e^{-sX}\big]\\[2ex] &=\displaystyle \int_{-\infty}^{\infty}{e^{-sx}}\,\text{pdf}(x)\, dx\\[2ex] &=\displaystyle \int_{-\infty}^{\infty}{e^{-(\sigma+i\omega)x}}\,\text{pdf}(x)\, dx\\[2ex] &=\displaystyle \int_{-\infty}^{\infty}\cancel{e^{-\sigma x}}\,\color{red}{e^{-i\omega x}\,\text{pdf}(x)\, dx} \end{align}$

这就给我们留下了用红色表示的那一部分表达式的不正确积分，对应于pdf的Fourier变换。

通常，函数的拉普拉斯变换极点的直觉是它们会提供函数的指数（衰减）和频率分量的信息（在本例中为pdf）。

为了回应评论中有关从切换到，这是一个完全具有战略意义的举措：一个表达式不能接follow而来。打个比方：我们拥有自己的汽车，每当需要处理一些事务时，我们都可以自由驶入城市（阅读，对等式积分，无论在每个单独的瞬间有多么艰难）。相反，我们可以做一些完全不同的事情：我们可以开车到最近的地铁站（阅读，只需解一次方程），然后从那里乘坐公共交通工具到达我们需要参观的每个地方（阅读，得到等式中的积分的导数以提取 $X^k$ $e^{tx}$ $(1)$ $(2)$ $k$ $(2)$ $k$ -我们需要的第一个时刻，知道了（由于等式），所有时刻都“藏在”那里，并通过评估为隔离）。 $(3)$ $0$

— 安东尼·帕雷拉达（Antoni Parellada）
source

如何取代？（

E [e^{t X}]

$E[e^{tX}]$

E [X^{k}]

$E[X^k]$

— 出乎意料

我希望能理解这个答案的外行是我的学生：)

— 阿克萨卡尔州

用大多数外行术语来说，这是一种将概率分布的所有特征编码为一个简短短语的方法。例如，如果我知道分布的MGF为我可以通过采用泰勒展开的第一项来找出该分布的均值：如果您知道自己在做什么，那比期望值要快得多概率函数。

M (t) = e^{t μ + 1 / 2 σ^{2} t^{2}}

$M(t)=e^{t\mu+1/2\sigma^2t^2}$

\frac{d}{d t} M (t) |_{t = 0} = μ + σ^{2} t |_{t = 0} = μ

$\frac d {dt}M(t)|_{t=0}=\mu+\sigma^2t|_{t=0}=\mu$

而且，由于此MGF编码了有关发行版的所有内容，因此，如果您知道如何操作该函数，则可以一次对发行版的所有特征进行操作！为什么我们不总是使用MGF？首先，并非在所有情况下MGF都是最简单的工具。其次，MGF并不总是存在。

外行之上

假设您具有标准正态分布。您可以通过陈述其PDF来表达您所知道的一切：

f (x) = \frac{1}{\sqrt{2 π}} e^{- x^{2} / 2}

$f(x)=\frac 1 {\sqrt{2\pi}}e^{-x^2/2}$

您可以计算其矩，例如平均值和标准偏差，并将其用于变换后的变量和随机法线等上的函数。

您可以将正态分布的MGF视为PDF的替代方案。它包含相同数量的信息。我已经展示了如何获得均值。

为什么我们需要替代方法？如我所写，有时只是更方便。例如，尝试从PDF计算标准法线的方差：并不是那么困难，但是使用MGF轻松得多：

σ^{2} = \int_{- \infty}^{\infty} x^{2} \frac{1}{\sqrt{2 π}} e^{- x^{2} / 2} d x = ?

$\sigma^2=\int_{-\infty}^\infty x^2\frac 1 {\sqrt{2\pi}}e^{-x^2/2} dx=?$

M (t) = e^{t^{2} / 2}

$M(t)=e^{t^2/2}$

σ^{2} = \frac{d^{2}}{d t^{2}} M (t) |_{t = 0} = \frac{d}{d t} t |_{t = 0} = 1

$\sigma^2=\frac {d^2} {dt^2}M(t)|_{t=0}=\frac d {dt} t |_{t=0}=1$

— 阿克萨卡尔族
source

您能否扩展一下它对分布进行编码的“所有内容”？

— ColorStatistics

要欣赏@ColorStatistics提出的观点，请参阅stats.stackexchange.com/questions/25010。

— ub

@whuber：谢谢你，胡布。我将研究该参考。这是我希望更好地理解的主题。

— ColorStatistics

我们如何证明MGF和PDF包含相同数量的信息？

— Aerin