修正的Dirichlet分布的期望值是多少?(整合问题)


14

使用具有相同比例参数的Gamma变量很容易产生具有Dirichlet分布的随机变量。如果:

XiGamma(αi,β)

然后:

(X1jXj,,XnjXj)Dirichlet(α1,,αn)

问题 如果比例参数不相等会怎样?

XiGamma(αi,βi)

那么这个变量的分布是什么?

(X1jXj,,XnjXj)?

对我来说,知道这种分布的期望值就足够了。
我需要一个可以由计算机非常快速地求值的近似封闭代数公式。
假设精度为0.01就足够了。
您可以假设:

αi,βiN

注意简而言之,任务是找到该积分的近似值:

f(α,β)=R+nx1jxjjβjαjΓ(αj)xjαj1eβjxjdx1dxn


1
@卢卡斯能说任何有关的参数α β ?可以获取j X j的精确表达式,从而逼近比率的期望值,但是对于参数的某些组合,人们可以以较少的工作利用正态或鞍点近似。我认为不会有通用的逼近方法,因此欢迎附加限制。nαiβijXj
ub

j X j是相关的,因此我们必须近似积分本身。α 是经常像1或2和少量有时大如10000同样王氏 β 但是它通常比大10倍 α X1jXjαiβiαi
卢卡斯卢

问题是与小。如果所有的α 都大,那么整个积分的好approxmiation为:α 1 / β 1αiαiα1/β1jαj/βj
卢卡斯路易斯

@Łukasz如果您需要评估期望的表达式,那么为什么需要代数公式?我正在考虑应用一些数字技巧来获得期望,但我需要一些反馈:)
deps_stats 2011-02-10

我需要在程序中对其进行多次评估。它必须非常快,即没有循环,最好没有太多的除法。
卢卡斯卢

Answers:


2

只是一个初步的说法,如果要计算速度,通常必须牺牲准确性。通常,“更多准确性” =“更多时间”。无论如何,这里是一个二阶近似值,应该改进您在上面的评论中建议的“粗略”近似值:

E(XjiXi)E[Xj]E[iXi]cov[iXi,Xj]E[iXi]2+E[Xj]E[iXi]3Var[iXi]
=αjiβjβiαi×[11(iβjβiαi)+1(iαiβi)2(iαiβi2)]

EDIT An explanation for the above expansion was requested. The short answer is wikipedia. The long answer is given below.

write f(x,y)=xy. Now we need all the "second order" derivatives of f. The first order derivatives will "cancel" because they will all involve multiples XE(X) and YE(Y) which are both zero when taking expectations.

2fx2=0
2fxy=1y2
2fy2=2xy3

And so the taylor series up to second order is given by:

xyμxμy+12(1μy22(xμx)(yμy)+2μxμy3(yμy)2)

Taking expectations yields:

E[xy]μxμy1μy2E[(xμx)(yμy)]+μxμy3E[(yμy)2]

Which is the answer I gave. (although I initially forgot the minus sign in the second term)


This looks like exactly what I need. Can you explain how you got this expansion? I tried in a lot of ways and was unable to do that ...
Łukasz Lew
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.