给定均值和标准差的正连续变量的最大熵概率密度函数是多少?


Answers:


13

您可能只是使用Boltzmann定理,即您所指向的Wikipedia文章中的定理。

请注意,指定均值和方差等效于指定前两个原始矩-分别确定另一个矩(实际上并不一定要调用此矩,因为我们可以将定理直接应用于均值和方差,因此这种方法要简单一些) )。

然后,该定理确定密度必须为以下形式:

f(x)=cexp(λ1x+λ2x2) for all x0

正实线的可积性会将限制为,我认为对 s 之间的关系设置了一些限制(当从指定的均值和方差而不是原始时刻开始时,可​​能会自动满足这些关系))。0 λλ20λ

令我惊讶的是(由于开始这个答案时我不会期望它),这似乎使我们的正态分布被截断了。

碰巧的是,我认为我以前没有使用过该定理,因此欢迎对我未曾考虑或遗漏的任何事物提出批评或有用的建议。


+1谢谢。似乎还好。当我阅读Wikipedia文章时,我似乎错过了玻耳兹曼定理适用于所有封闭区间的事实。我以为它仅适用于从到变量。
becko 2014年

由于某种原因,统一的基本量度以及由此产生的截断正态分布无法完全说服我:正如Fred Freder Schoen所强调的那样,要在连续情况下找到最大(相对)熵,我们需要一个基本量度或参考概率分布。由于所讨论的连续变量是正数,因此它可以是比例变量,并且由于各种原因(例如组不变性;请参阅Jaynes的书或Jeffreys的书),与成正比的基本度量会推荐自己。1 / xx1/x
pglpm

使用此基本度量,所得的分布与成比例,但不幸的是它是不可归一化的(尽管它仍然可以用作不正确的先验值, )。给定所讨论变量的正性,可能值得考虑将其对数矩作为信息载体和最大熵约束是否更有意义。它们将导致类似伽玛的最大熵分布。
1xexp(αxβx2)
pglpm

7

我想让@Glen_b的答案更明确,这是一个额外的答案,只是因为它不适合作为注释。

Jaynes的书的第11章和第12章很好地解释了形式主义等。以均匀分布为基础,@ Glen_b已经说过,一般解是高斯 对于无界变量,您可以根据约束值(维基百科文章中的)显式求解拉格朗日乘数和。使用,您将得到,因此标准高斯。

f(x)N(x|1/2λ1/λ2,1/(2λ2))
λ1λ2a1,a2a1=μ,a2=μ2+σ2ÑX | μ σ 2λ1=μ/σ2,λ2=0.5σ2N(x|μ,σ2)

对于有界变量,由于计算分区函数时出现错误函数项(维基百科中为),我(和mathematica)不再能够明确地求解。这意味着截断的高斯参数和不是您开始使用的连续变量的均值和方差。对于,甚至可能发生高斯模式为负的情况!当然,当您将时,所有数字都再次一致 。 λ 1 2 1 / ç μ σ 2 X 中号Ñ = 0 X 中号Ñ- x>xminλ1,21/cμσ2xmin=0xmin

如果您具有具体值,您仍然可以用数字方式求解并将解决方案插入到通用方程式中就可以完成!来自无界情况的的值可能是数值求解器的一个很好的起点。λ 1 2 λ 1 2a1,a2λ1,2λ1,2

这个问题是/math/598608/what-is-the-maximum-entropy-distribution-for-a-continuous-random-variable-on-0的重复

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.