伽玛随机变量对数的偏度


16

考虑伽玛随机变量 。对于均值,方差和偏度,有一些简洁的公式:XΓ(α,θ)

E[X]=αθVar[X]=αθ2=1/αE[X]2Skewness[X]=2/α

现在考虑对数转换后的随机变量。维基百科给出了均值和方差的公式:Y=log(X)

E[Y]=ψ(α)+log(θ)Var[Y]=ψ1(α)

通过digamma和trigamma函数定义为γ函数对数的一阶和二阶导数。

偏度的公式是什么?

会出现四伽马功能吗?

(让我对此感到疑惑的是在对数正态分布和伽马分布之间进行选择,请参阅Gamma与对数正态分布。在其他方面,它们的偏度属性有所不同。特别是,对数正态的对数偏度几乎等于零。伽玛对数的偏度为负。但是如何为负?


1
请问帮助?还是这个
S. Kolassa-恢复莫妮卡

我不太确定什么是对数伽玛分布。如果它与伽马相关,因为对数正态与正态有关,那么我在问其他问题(因为“对数正态”令人困惑,是exp(正态)的分布而不是log(正态)。
变形虫说莫妮卡(Reonica Monica)

1
@Glen_b:说实话,我想称法线的指数为“对数法线”会更加不一致和令人困惑。虽然,不幸的是,已经建立了。
S. Kolassa-恢复莫妮卡

2
@Stephan另请参阅对数物流,对数Cauchy,对数Laplace等。与相反的
概念

1
是的 由于这个原因,我一直小心不要在与该分布有关的任何地方说“ log-gamma”。(我过去一直以与对数正态一致的方式使用它)
Glen_b-恢复莫妮卡(Monica

Answers:


12

此刻生成函数的是在这种情况下有帮助的,因为它具有简单的代数形式。根据mgf的定义,我们有Y = ln X M t M(t)Y=lnX

M(t)=E[etlnX]=E[Xt]=1Γ(α)θα0xα+t1ex/θdx=θtΓ(α)0yα+t1eydy=θtΓ(α+t)Γ(α).

让我们验证您的期望和方差。取导数,我们有和因此,然后是中号=Γα+

M(t)=Γ(α+t)Γ(α)θt+Γ(α+t)Γ(α)θtln(θ)
E[Y]=ψ0α+lnθ
M(t)=Γ(α+t)Γ(α)θt+2Γ(α+t)Γ(α)θtln(θ)+Γ(α+t)Γ(α)θtln2(θ).
VARÝ=ë[ÿ2]-ë[ÿ]2=Γα
E[Y]=ψ(0)(α)+ln(θ),E[Y2]=Γ(α)Γ(α)+2ψ(0)(α)ln(θ)+ln2(θ).
Var(Y)=E[Y2]E[Y]2=Γ(α)Γ(α)(Γ(α)Γ(α))2=ψ(1)(α).

要查找偏斜度,请注意累积量生成函数(感谢尖端的@probabilityislogic)为因此,第一个累积量就是。回想,因此后续累积量为,。因此偏度为ķ '0 = ψ 0 α + LN θ ψ Ñ X = d Ñ + 1 LN Γ

K(t)=lnM(t)=tlnθ+lnΓ(α+t)lnΓ(α).
K(0)=ψ(0)(α)+ln(θ) ķ Ñ 0 = ψ ñ - 1 α ñ 2 ë [ ÿ - ë [ ÿ ] 3 ]ψ(n)(x)=dn+1lnΓ(x)/dxn+1K(n)(0)=ψ(n1)(α)n2
E[(YE[Y])3]Var(Y)3/2=ψ(2)(α)[ψ(1)(α)]3/2.

作为附带说明,AC Olshen在“ Pearson III型分布的转换”中似乎已经对该特定分布进行了彻底研究,Johnson等人的“ 连续单变量分布”也对此做了很小的论述。看看那些。


3
您应该区分而不是因为它是累积量生成函数-与中心矩更直接相关-其中是多伽玛函数K(t)=log[M(t)]=tlog[θ]+log[Γ(α+t)]log[Γ(α)]M(t)skew=K(3)(0)=ψ(2)(α)ψ(n)(z)
概率

1
@probabilityislogic:非常好的电话,改变了我的答案
弗朗西斯

@probabilityislogic这是一个很好的补充,非常感谢。我只想指出,以免有些读者感到困惑,偏斜度不是由第三累积量直接给出的:这是第三标准时刻,而不是第三中心时刻。弗朗西斯的回答是正确的,但您评论中的最后一个公式不太正确。
变形虫说莫妮卡(Reonica Monica)

13

一,直接计算

Gradshteyn&Ryzhik [1](第4.358,第7版)列表的显式封闭形成用于为而情况是在4.352中完成的(假设您将和函数中的表达式视为闭合形式)–从中可以肯定地得出峰度;他们将所有的积分作为伽马函数的导数给出,因此推测更高是可行的。因此偏斜当然是可行的,但并不是特别“整洁”。

0xν1eμx(lnx)pdx
p=2,3,4p=1Γ,ψζp

在[2]中详细介绍了4.358中公式的推导过程。我将引用那里给出的公式,因为它们更加简洁明了,并将4.352.1设置为相同的形式。

令。然后:δ=ψ(a)lnμ

0xa1eμxlnxdx=Γ(a)μa{δ}0xa1eμxln2xdx=Γ(a)μa{δ2+ζ(2,a)}0xa1eμxln3xdx=Γ(a)μa{δ3+3ζ(2,a)δ2ζ(3,a)}0xa1eμxln4xdx=Γ(a)μa{δ4+6ζ(2,a)δ28ζ(3,a)δ+3ζ2(2,a)+6ζ(4,a))}

其中是Hurwitz zeta函数(Riemann zeta函数是特殊情况)。ζ(z,q)=n=01(n+q)zq=1

现在来看伽玛随机变量的对数时刻。

首先要注意的是,在对数刻度上,伽马密度的刻度或速率参数仅仅是一个偏移参数,因此对中心矩没有影响。我们可以将我们曾经使用的任何一个都设为1。

如果则XGamma(α,1)

E(logpX)=1Γ(α)0logpxxα1exdx.

我们可以在上述积分公式中设置,这给了我们原始的时刻。我们有,,,。μ=1E(Y)E(Y2)E(Y3)E(Y4)

由于我们从上面消除了,因此不必担心混淆,我们现在可以自由地重用来表示第个中心矩。然后,我们可以通过通常的公式从原始弯矩中获得中心弯矩。μμkk

然后,我们可以获得和的偏度和峰度。μ3μ23/2μ4μ22


术语说明

似乎Wolfram的参考页使用polygamma函数来此分布的时刻(它们称为ExpGamma分布)。

相比之下,Chan(见下文)将其称为对数伽马分布。


二。通过MGF的Chan公式

Chan(1993)[3]给出mgf为非常整齐的。Γ(α+t)/Γ(α)

(使用简单的事实的mgf 只是,这在Francis的答案中给出了一个非常好的推论。)log(X)E(Xt)

因此,这些时刻具有相当简单的形式。陈给:

E(Y)=ψ(α)

和中心时刻为

E(YμY)2=ψ(α)E(YμY)3=ψ(α)E(YμY)4=ψ(α)

因此偏度为,峰度为。大概我上面的较早公式可以简化为这些公式。ψ(α)/(ψ(α)3/2)ψ(α)/(ψ(α)2)

方便地,R提供了digamma()和trigamma()函数以及更通用的polygamma函数,您可以在其中选择导数的阶数。(许多其他程序提供类似的便捷功能。)ψψ

因此,我们可以直接在R中直接计算偏度和峰度:

skew.eg <- function(a) psigamma(a,2)/psigamma(a,1)^(3/2)
kurt.eg <- function(a) psigamma(a,3)/psigamma(a,1)^2

尝试一些值a(上面的),我们在Chan [3]的2.2节的末尾重现了该表的前几行,除了该表中的峰度值应该是多余的峰度,但是我只是根据Chan给出的公式计算峰度;这些应该相差3。α

(例如,对于日志的指数的,该表表示,过量峰度是2.4,但公式就是 ...,这 2.4。 )β2ψ(1)/ψ(1)2

仿真证实,随着我们增加样本量,指数对数的峰度收敛到5.4左右而不是2.4。看来论文可能有误。

因此,Chan的中心矩公式似乎实际上是累积量的公式(请参见弗朗西斯答案的推导)。这将意味着偏度公式按原样是正确的;因为第二和第三累积量等于第二和第三中心矩。

不过,只要我们牢记会导致kurt.eg峰度过高,这些公式就特别方便。

参考文献

[1] Gradshteyn,IS和Ryzhik IM(2007),《积分表,系列和产品》,第7版。
学术出版社

[2] Victor H. Moll(2007)
Gradshteyn和Ryzhik中的积分,第4部分:伽马函数SCIENTIA
系列A:数学科学,第1卷。
15、37–46智利瓦尔帕莱索圣玛丽亚大学费德里科大学
http://129.81.170.14/~vhm/FORM-PROOFS_html/final4.pdf

[3] Chan,PS(1993年),
对数伽马分布的统计研究,
麦克马斯特大学(博士学位论文)
https://macsphere.mcmaster.ca/bitstream/11375/6816/1/fulltext.pdf


1
凉。非常感谢!根据斯蒂芬链接到上面的百科全书条目,关于偏斜度的最终答案是(几乎可以看作是“整洁”!)。因此,似乎所有可怕的zeta都必须取消。ψ(α)/ψ(α)3/2
变形虫说莫妮卡(Reonica Monica)

1
抱歉,现在才看到您的评论(我已经编辑了大约一个小时左右);没错,尽管如果百科全书像陈在论文中那样给出峰度,那似乎是错误的(如上所述),但很容易纠正。简洁的公式似乎是针对累积量而不是标准化的中心矩。
Glen_b-恢复莫妮卡

是的,百科全书确实为峰度给出了相同的公式。
变形虫说莫妮卡(Reonica Monica)

嗯,我的意思是指通常表示为和。我会解决。γ1γ2
Glen_b-恢复莫妮卡的时间

2
我可能应该补充一点,Hurwitz zeta函数可以用多伽马函数表示,反之亦然:因此,@ amoeba问题“四伽马函数会出现吗?”的答案。是是的。
ψ(n)(z)=(1)n+1Γ(n+1)ζ(n+1,z)
JM不是统计学家
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.