两个正态分布随机变量之间的欧几里得距离的分布是什么?


41

假设给了两个对象,它们的确切位置是未知的,但是根据具有已知参数的正态分布(例如和。我们可以假设它们都是双变量法线,这样位置就由坐标上的分布来描述(即和是分别包含和的预期坐标的向量)。我们还将假定对象是独立的。aN(m,s)bN(v,t))(x,y)mv(x,y)ab

有谁知道这两个对象之间的欧几里德距离平方的分布是否是已知的参数分布?还是如何通过分析得出此功能的PDF / CDF?


4
如果所有四个坐标都不相关,则应该获得非中心卡方分布的倍数。否则,结果看起来要复杂得多。
whuber

@whuber,您可以提供有关所得非中心卡方分布的参数与对象a,b的参数之间的关系的任何详细信息/指针,这太棒了
Nick

4
@Nick Wikipedia文章的前几段提供了详细信息。通过查看特征的功能,你可以建立一个类似的结果,是不是可以当不是所有的差异都相同或有一定相关性。
whuber

@Nick,为了澄清,和都是随机向量,其值在?abR2
mpiktas 2011年

1
@Nick,如果和共同是正常的,则差异也就是也正常。那么您的问题是找到随机法线向量的分布。谷歌搜索我发现了这个链接。本文描述了更为复杂的问题,在某些情况下与您的情况相吻合。这给您一个肯定的答案的希望。参考资料可能会为您提供进一步的搜索思路。abab
mpiktas 2011年

Answers:


24

这个问题的答案可以在Mathai和Provost(1992,Marcel Dekker,Inc.)的随机变量二次形式》一书中找到。

正如评论所阐明的,您需要找到的分布,其中 遵循具有均值和协方差矩阵的双变量正态分布。这是二元随机变量的二次形式。Q=z12+z22z=abμΣz

简而言之,对于维情况,和一个很好的一般结果 是,矩生成函数为 其中是的本征值和是的线性函数。请参阅上面引用的书中的定理3.2a.2(第42页)(在此假设为非奇数)。另一个有用的表示形式是3.1a.1(第29页) 其中pzNp(μ,Σ)

Q=j=1pzj2
E(etQ)=etj=1pbj2λj12tλjj=1p(12tλj)1/2
λ1,,λpΣbμΣ
Q=j=1pλj(uj+bj)2
u1,,up是iid。N(0,1)

本书的整个第4章专门介绍密度和分布函数的表示和计算,这一点都不小。我只是从表面上熟悉这本书,但我的印象是,所有的一般表示形式都是无限级数展开的。

因此,从某种意义上说,问题的答案是,是的,两个双变量法线向量之间的平方欧几里德距离的分布属于已知的(并且经过充分研究)分布类别,该分布类别由四个参数参数化。和。但是,我很确定您不会在标准教科书中找到此发行版。λ1,λ2>0b1,b2R

此外,请注意,和不必独立。联合正态性就足够了(如果它们是独立的且每个正态则是自动的),则差服从正态分布。abab


1
感谢您的参考,我找到了这本书,并正在慢慢尝试着逐步解决问题
尼克

@NRH我在对称情况下()通过MGF亲自工作,其中而不是的总和是。仿真验证了第一刻。这可能是您提到的“线性函数”,并且这是对称情况所特有的,但是我想我会指出来,以防出现错误。 p = 2 b 2 Ĵ λ Ĵ μ 2 Ĵλj=σ2p=2bj2λjμj2
凯尔

实际上,根据它们对的定义,在对称(具有共同方差的独立维)情况下,指数中的分子的确减小为。μ 2 Ĵbjμj2
凯尔2014年

7

首先定义差异向量的二元分布 ,其简单地为;这源自多元不确定性传播,涉及块对角矩阵和Jacobian。Σ d = Σ 1 + Σ 2μd=μ1μ2Σd=Σ1+Σ2 Σ 12 = [ Σ 1Σd=JΣ12JTĴ=[ + - ]Σ12=[Σ1Σ2]J=[+I,I]

其次,寻找差矢量长度的分布,或到原点的径向距离,即Hoyt分布

用极坐标(半径和角度)重写的,具有不等方差的双变量相关正态随机变量中真实均值周围的半径遵循Hoyt分布。pdf和cdf以封闭形式定义,数字根查找用于查找cdf ^ -1。如果相关性为0并且方差相等,则减少为瑞利分布。

如果您允许Ballistipedia产生偏差(原点偏移),则会产生更一般的分布: xy坐标的分布及其径向误差


2
+1,但我认为值得指出的是,这个问题与您的人物所说的“一般情况”有关。
变形虫说恢复莫妮卡

1

为什么不测试呢?

set.seed(347)
x <- rnorm(10000)
y <- rnorm(10000)
x2 <- rnorm(10000)
y2 <- rnorm(10000)

qdf <- data.frame(x,y,x2,y2)
qdf <- data.frame(qdf,(x-x2)^2+(y-y2)^2)
colnames(qdf)[5] <- "euclid" 

plot(c(x,y),c(x2,y2))
plot(qdf$euclid)
hist(qdf$euclid) 
plot(dentist(qdf$euclid))

情节1 剧情2 情节3 剧情4


2
原始问题的评论家已经说明,如果方差相同且变量不相关,将会是什么样。举例说明并非如此的情况可能会更有启发性。
Andy W

你能提供这样的例子吗?
Brandon Bertelsen

您需要做的就是生成相关或具有不同方差的x和y值。可以直接在代码中完成不同的变化。您可以使用MASS软件包中的mvrnorm从指定的协方差矩阵生成值。另外,我不确定上面的代码中的“牙医”功能是什么,是否应该是“密度”。
Andy W

1
话虽如此,通过数学来弄清楚为什么会这样(以及如何处理方差/协方差会改变分布)可能同样具有启发性。对我来说,仅通过观察胡伯提到的特征函数,为什么会出现这种情况并不清楚。尽管对加,减和乘随机变量的规则有一个简单的了解,似乎可以使您逐步理解为什么。
Andy W
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.