具有可参数化协方差矩阵的正k维象限的分布是什么?


12

zzk关于其负模拟问题的问题之后,我想知道正k维象限上的参数化分布族是什么,可以为其设置协方差矩阵。 ΣR+kΣ

zzk所讨论的那样,从的分布开始并应用线性变换不起作用。 XΣ 1 / 2X-μ+μR+kXΣ1/2(Xμ)+μ

Answers:


6

假设我们有一个多变量正态随机向量 与和全秩对称正定矩阵。μ ∈ [R ķ ķ × ķ Σ = σ Ĵ

(logX1,,logXk)N(μ,Σ),
μRkk×kΣ=(σij)

对于对数正态,不难证明 中号= ë [ X ] = Ë μ + σ / 2(X1,,Xk)c i j= Cov [ X iX j ] = m i

mi:=E[Xi]=eμi+σii/2,i=1,,k,
cij:=Cov[Xi,Xj]=mimj(eσij1),i,j=1,,k,

然后是。cij>mimj

因此,我们可以提出相反的问题:给定和对称正定矩阵,满足,如果让 我们将得到一个具有规定均值和协方差的对数正态向量。 ķ × ķ Ç = Ç Ĵç Ĵ > - 中号Ĵ μ = 日志 - 1m=(m1,,mk)R+kk×kC=(cij)cij>mimjσ Ĵ = 日志Ç Ĵ

μi=logmi12log(ciimi2+1),i=1,,k,
σij=log(cijmimj+1),i,j=1,,k,

对和的约束等效于自然条件。m E [ X i X j ] > 0CmE[XiXj]>0


太棒了,保罗!您在协方差矩阵上得到了可行的解决方案和适当的条件,这也回答了这个问题。最终,对数正态证明比伽玛更方便。
西安

3

实际上,我绝对有行人解决方案。

  1. 以开头,然后选择两个参数以适合,。X1Ga(α11,β1)E[X1]var(X1)
  2. 取并选择三个参数以适合,和。X2|X1Ga(α21X1+α22,β2)E[X2]var(X2)cov(X1,X2)
  3. 取并选择四个参数以适合的值,,和。X3|X1,X2Ga(α31X1+α32X2+α33,β3)E[X3]var(X3)cov(X1,X3)cov(X2,X3)

等等...但是,考虑到参数的约束和力矩方程的非线性性质,可能是某些力矩集对应于不可接受的参数集。

例如,当,我得出方程组 k=2

β1=μ1/σ12,α11μ1β1=0

α22=μ2β2α21μ1,α21=(σ12+μ1μ2μ2)σ12+μ12μ1β2
(σ12+μ1μ2μ2)2(σ12+μ12μ1)2σ12+μ2β2=σ22.
以和任意(和先验可接受)值运行R代码导致许多情况下没有解决方案。再次,这并不意味着什么,因为上的分布的相关矩阵可能具有更强的限制,而仅仅是纯粹的行列式。μΣR+2

更新(04/04): Deinst 在数学论坛上将此问题重新表述为一个新问题


1
略微扩展此范围的一种方法是考虑自然指数族 那么均值和协方差就是的梯度和Hessian 。如果是多项式(实数> -1),则是多项式的对数(实数),方差和Hessian是有理函数。我认为这给了足够的自由来表示任何均值和协方差矩阵。
f(X|θ)=h(x)eθTXA(θ).
AhA
deinst 2012年

@deinst:(+1)您是否有一个示例可以直接利用此指数族表示形式?
西安,

2
也许我不太了解这个问题。但是,请考虑具有相同边际且在上具有完全支持且均值的双变量随机向量。例如,这样的二元分布如何使相关性接近-1?试探性地,尽管我没有执行此操作,但是,如果,那么关于支持的矛盾必定会出现。没有?(X,Y)FR+0<μ<ρP(X>2μ)>0
主教

1
当支持为,协方差矩阵肯定存在约束,并通过Stieltjes矩条件覆盖。无论如何,我看不出为什么先验地排除接近-1的相关性。ΣR+k
西安

2
是的,这与我的理解有关。关于相关性,请考虑我的示例。如果和具有相同的边际且均值且正相关为-1并且,那么对于所有此类实现,的值必须是什么?(问题和答案均为+1。我喜欢这个。)XYFμP(X>2μ)>0YX
红衣主教

2

好的,这是对西安的评论的回应。它太长了,必须进行大量TeX处理才能发表自如。注意事项:几乎可以肯定,我犯了一个代数错误。这似乎没有我最初想到的那么灵活。

让我们在中创建一个分布族,形式为 令和。令 是一个两项多项式,其中是所有都大于0的实数。然后我们发现 R+3

f(x|θ)=h(x)eθTxA(θ)
x=(x,y,z)θ=(θ1,θ2,θ3)
h(x)=cx1e11x2e21x3e31+dx1f11x2f21x3f31
ei,fii
A(θ)=log(cΓ(e1)θ1e1Γ(e2)θ2e2Γ(e3)θ3e3+dΓ(f1)θ1f1Γ(f2)θ2f2Γ(f3)θ3f3).

现在,为方便起见,让我们定义 和

c=cΓ(e1)Γ(e2)Γ(e2)θ1f1θ2f2θ3f3
d=dΓ(f1)Γ(f2)Γ(f2)θ1e1θ2e2θ3e3

现在,由于分布的均值为的梯度,因此 ,和。并且由于协方差是的Hessian ,我们有 和 (协方差矩阵的其他项是通过以明显的方式更改下标而获得的)。AμX=e1c+f1dθ1(c+d)μY=e2c+f2dθ2(c+d)μZ=e3c+f3dθ3(c+d)A冠状病毒XÝ=ë1-˚F1Ë2-˚F2ç'd'

σX2=(e1c+f1d)(c+d)+(e1f1)2cdθ12(c+d)2
Cov(X,Y)=(e1f1)(e2f2)cdθ1θ2(c+d)

似乎没有足够的灵活性来获取任何协方差矩阵。我需要尝试多项式中的另一个项(但我怀疑这可能也不起作用(显然我需要对此进行更多考虑))。


五个约束的四个参数 ...?(θ1,θ2,θ3,c)
西安

@xian还有6个指数和。˚F eifi
deinst 2012年

我有些困惑(?):您没有将指数作为指数族的参数进行处理。但是实际上,您可以根据自己的意愿更改这些能力,以正确设置9矩方程。
西安

@西安您是正确的,我没有将它们作为指数族的参数进行处理。这样做将使这个家庭不再是自然家庭,包括他们在内,将使代数方程的计算方程变得混乱(从一开始就被混淆)。
deinst'Apr
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.