Dirac的delta函数是否应被视为高斯分布的子类?


10

在Wikidata中,可以将本体中的概率分布(像其他所有事物一样)联系起来,例如,t分布是非中心t分布的子类,请参见,例如,

https://angryloki.github.io/wikidata-graph-builder/?property=P279&item=Q209675&iterations=3&limit=3

存在多种限制情况,例如,当t分布中的自由度变为无穷大时,或者当正态分布(高斯分布)的方差接近零时。在后一种情况下,分布将​​趋向于Dirac的delta函数。

我注意到,在英语Wikipedia上,方差参数当前被表示为大于零,因此严格解释下,人们不会说Dirac的delta函数是正态分布的子类。但是,对我来说似乎还可以,因为我要说指数分布是狄拉克三角函数的超类。

说明Dirac的delta函数是高斯分布的子类是否有问题?


1
如果狄拉克三角洲是高斯的一个子类,那么其峰度必须为3,对吗?
阿克萨卡尔邦

我猜想,如果我们将狄拉克三角洲视为几种概率分布的子类,则狄拉克三角洲的峰度不一致。它反对将狄拉克三角洲视为这些分布中任何一个的子类。
FinnÅrupNielsen

在概率上下文中,增量被描述为广义函数。这不是普通的功能
Aksakal

Answers:


10

狄拉克三角洲在方便时被视为高斯分布,而在这种观点要求我们作例外的情况下,则不会被视为高斯分布。

例如,如果对于所有实数选择,是高斯随机变量,则说享有 多元高斯分布。(注意:这是“高级”统计信息中的标准定义)。由于一个选择是,因此标准定义将常数(退化的随机变量)视为高斯随机变量(均值和方差)。另一方面,当我们考虑类似的东西时,我们会忽略对狄拉克三角洲作为高斯分布的看法i a i X i a 1a 2a n a 1 = a 2 = = a n = 0 0 0(X1,X2,,Xn)iaiXia1,a2,,ana1=a2==an=000

“具有标准偏差的零均值高斯随机变量的累积概率分布函数(CDF)为 ,其中是标准高斯随机变量的CDF。”˚F XX = P { X X } = Φ XσΦ

FX(x)=P{Xx}=Φ(xσ)
Φ()

请注意, 如果我们将狄拉克增量(Dirac delta)视为零均值高斯随机变量序列的极限情况(其标准偏差接近,因此是高斯随机变量),则该说法几乎正确的,并不完全正确。的狄拉克δ的CDF具有值为而01x0

limσ0Φ(xσ)={0,x<0,12,x=0,1,x>0.
但是,很多人会告诉您,将狄拉克三角洲视为高斯分布完全是胡说八道,因为他们的书说高斯随机变量的方差必须为正数(其中有些人会投票反对该答案以表明他们的不满)。几年前在stats.SE上对这一点进行了非常激烈而富有启发性的讨论,但不幸的是,这仅是在答案的评论中(我相信@Macro),而不是作为单独的答案,我无法再次找到它。 。

3
+1。我不确定CDF是否存在问题,因为我认为在任何限制的跳跃时CDF序列的限制值都无关紧要。有两种查看方法。要注意的是,您的限制公式不是有效的CDF(它不是cadlag)。另一个要注意的是,当同时让 时,您将获得的Dirac分布,但是您可以尝试获得的极限值为到之间的任何(或完全没有限制)。μ σ 0 0 Φ μ σ0 0(μ,σ)(0,0)Φμ,σ(0)101
ub

6
您引用的对话发生在此答案的评论中,尽管我衷心希望对大多数读者来说,讨论不会显得激烈。(+1)
红衣主教

1
@cardinal对我们社区的深入了解。做得好!
马修·德鲁里

10

增量函数适合于分布的数学理论(这与概率分布的理论截然不同,此处的术语不会造成更多混淆)。

本质上,分布是广义函数。不能像函数一样对它们进行评估,但是可以对其进行集成。更准确地说,分布定义如下D

令为测试函数的集合。测试功能是真实,诚实的功能,流畅,支持紧凑。分布是线性映射θ d Ť řTθD:TR

诚实函数由积分运算符确定分布f

T(θ)=+f(x)θ(x)dx

有些分布与真实函数不相关,狄拉克算子就是其中之一

δ(θ)=θ(0)

从这个意义上讲,您可以将狄拉克视为正态分布的一种极限情况。如果是均值为零且方差为的正态分布的pdf族,则对于任何检验函数θNttθ

θ(0)=limt0+Nt(x)θ(x)dx

这可能更常见地表示为

θ(0)=+δ(x)θ(x)dx=limt0+Nt(x)θ(x)dx

数学家会认为这是滥用符号,因为表达式实际上没有任何意义。但是话又说回来,是谁来批评狄拉克,他是最棒的。δ(x)

当然,这是否使狄拉克成为正态分布的成员是一个文化问题。在这里,我只是给出一个理由,为什么要这样考虑。


我同意你的说法,但我认为这恰恰相反。增量函数不是高斯的子集。正如连续函数的限制不一定是连续函数。
seanv507 '16

@ seanv507我尽力不提出任何一种结论!
Matthew Drury

1
我认为分布与概率分布非常相似,狄拉克三角洲(概率)分布表示确定性变量...
user541686

如果您不写积分的极限,则它们可能会混淆不确定的积分。而且,这句话没有意义:“测试函数θ是真实的,对上帝的函数诚实,平滑且具有紧凑的支持”。
ogogmad

@jkabrg为什么没有意义?自从我写了它以来,我很难看到它没有意义。
马修·德鲁里

-1

不。它不是正态分布的子类。

我认为混淆来自狄拉克函数的一种表示。请记住,它的定义如下:

δX=0X0

δ(x)dx=1
δ(x)=0,x0

它被定义为整数,这很不错,但是有时您需要通过函数表示而不是整数来对其进行操作。因此,人们提出了各种各样的选择,其中之一看起来像是高斯密度:

δ(x)=limσ0ex22σ22πσ

但是,这不是唯一的表示形式,例如:

δ(x)=12πk=eikx,x(π,π)

因此,最好根据其整体定义来考虑Dirac函数,并将函数表示形式(例如高斯函数)视为方便的工具。

更新到@whuber的观点,一个更好的甚至更好的例子是狄拉克三角洲的这种表示:

δ(x)=limσ0e|x|σ2σ

这看起来像拉普拉斯分布吗?难道我们不应该将狄拉克三角洲视为拉普拉斯分布的子类吗?


在此答案的某个点上,您似乎从讨论发行版转向了讨论“功能”。该问题明确涉及“概率分布”。这些通常不是由密度函数给出的,但是可以由它们的分布函数给出。原子的分布(“狄拉克三角洲”)与所有其他高斯分布都很好地匹配为极限情况。(在Matthew Drury的设置中,将其定义为该限制!)您的论点似乎类似于声称圆不是椭圆。强制执行此类异常似乎没有建设性。
ub

@whuber,什么是“原子分布”?
阿克萨卡尔邦

“原子”是单点概率。等效地,几乎在任何地方都是恒定的任何随机变量的分布。
ub

@whuber,哦,我在想一个物理原子。不,我的观点是,狄拉克的delta是不是高斯的子类,因为它可以代表也通过拉普拉斯像发行版
Aksakal

3
回复:关于Laplace分布的观点。正如正方形既是矩形又是菱形,并且均匀分布既是均匀分布又是Beta分布(即分布的特例可以属于多个已命名的分布族。实际上,增量分布属于每个位置范围族,并且至少一个增量分布属于每个规模族。从几何上讲,族是分布空间中的曲线。给定的分布是一个点;并且(显然)任何点都可能属于许多曲线。0 θ (0,1)(0,θ)(α,β)
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.