观测级马氏距离的分布


23

如果我有多元正态iid样本并定义(这是使用矩阵进行加权的从采样点到矢量的马氏距离[平方] ),的分布是什么(样本均值使用样本协方差矩阵)?d 2 b = X - b ' - 1X - b X1,,XnNp(μ,Σ)

di2(b,A)=(Xib)A1(Xib)
aA ˉ X小号di2(X¯,S)X¯S

我正在看一篇声称它是,但这显然是错误的:使用(未知)总体均值向量可以得到的分布和协方差矩阵。当插入示例类似物时,应该获得Hotelling分布或缩放的分布,或类似的东西,而不是。我在Muirhead(2005)Anderson(2003)Mardia,Kent和Bibby(1979,2003 )中都找不到确切的结果。χp2χp2di2(μ,Σ)T 2F()χp2。显然,这些人没有理会异常的诊断,因为多元正态分布是完美的,并且每次收集多元数据时都容易获得:-/。

事情可能比这更复杂。Hotelling分布结果是基于假设矢量部分和矩阵部分之间的独立性而得出的。这种独立性适用于和,但它不再适用于和。T 2X¯SXiS


在的定义中,您是否仍将视为随机变量,或者现在将其视为固定向量?包括下标表明是后者,但这似乎有些奇怪。di2Xi
ub

1
只是一些现成的旁注,但请注意相对于是辅助的,而等于一个固定常数(应该肯定是或类似的值)。XiX¯μidi2(X¯,S)np
主教

1
@whuber-也许要强调它是使用样本中的观察值而不是新观察值计算的?
jbowman 2012年

1
@whuber,大致按照jbowman所说的来表示-表示这是观察水平的统计信息(与样本水平的统计信息相对,例如样本均值)。
StasK 2012年

1
的分布是β,ñ /ñ - 1 2 d 2 ˉ X小号p / 2 Ñ - p - 1 / 2 ,但我仍在寻找d 2 iμ S )的分布di2(X¯,S)n/(n1)2di2(X¯,S)B(p/2,(np1)/2)di2(μ,S)。所述的分布的不是独立的。di2

Answers:


18

通过利用Mahalanobis距离替代链接)来检查高斯混合模型 。参见第13页,第二栏。作者也提供了一些推导分布的证据。分布按比例缩放。如果这不适合您,请告诉我。否则,我明天可以查看SS Wilks书中的任何提示。


4
n(n1)2di2(X¯,S)B(p2,np12)

9

df=p

n(d2)(n1)2Beta(p2,(np1)2).
xi
(nd2(np)(p(n1)(n+1))F(p,np)

LATEX

您可以为F公式提供参考吗?
eyaler

1
一篇相关的参考资料,见Hardin,Johanna和David M. Rocke的第3节。2005.“稳健距离的分布”,计算与图形统计杂志14(4):928–46。doi:10.1198 / 106186005X77685。
约瑟夫,
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.