维中两个随机单位向量的标量积的分布


27

如果和是中的两个独立的随机单位矢量(均匀分布在单位球面上),它们的标量积(点积)的分布是什么吗?xyRDxy

我猜想随着的分布迅速增长(?)成为均值为零的正态值,并且在较高维度方差减小但是对于\ sigma ^ 2(D)D

limDσ2(D)0,
σ2(D)

更新资料

我进行了一些快速模拟。首先,为D = 1000生成10000对随机单位向量,D=1000很容易看到它们的点积分布完全是高斯分布(实际上对于D=100,它已经是高斯分布了),请参见左侧的子图。其次,对于从1到10000的每个D(以递增的步长),我生成了1000对并计算了方差。对数-对数图显示在右侧,很明显公式很容易被1 / D近似1/D。请注意,对于D=1D=2此公式甚至可以给出准确的结果(但我不确定以后会发生什么)。

随机单位向量之间的点积


@KarlOskar:谢谢,此链接非常相​​关,实际上使我的问题几乎是重复的,但并非完全相同。因此,有一个针对的显式公式,该公式是点积的累积分布函数。可以取一个导数来获取PDF,然后研究极限。但是,该公式是根据beta函数和不完整的beta函数给出的,因此计算可能很麻烦。P{(x,y)>ϵ}D
变形虫说恢复莫妮卡2014年

@KarlOskar:来自单位球面上的均匀分布。为了从这种分布生成随机向量,可以从高斯单元生成具有单位方差的随机向量,然后对其进行归一化。RD
变形虫说恢复莫妮卡2014年

Answers:


30

因为(众所周知)通过对变量正态分布进行归一化而获得了单位球面上的均匀分布, 并且归一化向量的点积是它们的相关系数,所以这三个问题的答案问题是:SD1Dt

  1. u=(t+1)/2具有Beta分布。((D1)/2,(D1)/2)

  2. 的方差等于(如问题所推测)。t1/D

  3. 的标准化分布以的速率接近正态tO(1D).


方法

容易从几何上轻松获得单位矢量点积的精确分布,因为这是第二个矢量在第一个方向上的分量。由于第二矢量与第一矢量无关,并且均匀地分布在单位球体上,因此它在第一方向上的分量与球体的任何坐标相同地分布。(请注意,第一个向量的分布无关紧要。)

求密度

因此,以该坐标为最后一个坐标,处的密度与单位球面上位于到之间的高度的表面积成比例。该比例出现在高度为且半径为这实际上是由半径为的构成的圆锥形截头锥体的高度和斜率。概率与t[1,1]tt+dtdt1t2,SD21t2,dt1/1t2

(1t2)D21t2dt=(1t2)(D3)/2dt.

令意味着。将其替换为前面的值将使概率元素达到归一化常数:u=(t+1)/2[0,1]t=2u1

fD(u)du(1(2u1)2)(D3)/2d(2u1)=2D2(uu2)(D3)/2du.

立即具有Beta分布,因为(根据定义)其密度也与u=(t+1)/2((D1)/2,(D1)/2)

u(D1)/21(1u)(D1)/21=(uu2)(D3)/2fD(u).

确定极限行为

使用基本技术可以很容易地从中获得有关极限行为的信息:可以集成以获得比例常数 ; 可以积分(例如,使用Beta函数的属性)以获得矩,从而表明方差为并缩小为(因此,根据切比雪夫定理,该概率变得集中于附近)); 然后通过考虑标准化分布的密度值(与成正比)来分布。fDΓ(n2)πΓ(D12)tkfD(t)1/D0t=0fD(t/D),t

log(fD(t/D))=C(D)+D32log(1t2D)=C(D)(1/2+32D)t2+O(t4D)C12t2

其中代表积分的(对数)常数。显然,接近常态的速度(对数密度等于的比率C12t2O(1D).

数字

该图显示了标准化为单位方差的 4、6、10的点积的密度及其极限密度。处的值随增大(对于标准法线密度,从蓝色到红色,金色和绿色)。在此分辨率下,的密度与正常密度是无法区分的。D=4,6,100DD=1000


4
(+1)非常感谢@whuber,这是一个很好的答案!特别感谢您提到“平截头体”一词。碰巧的是,在您发布您的答案的几分钟前,我已经接受了另一个答案,而我现在不希望接受它。希望你能理解。可惜不能接受两者!顺便说一句,请注意一个非常简单的关于表达式与该答案的差异的证明:一个人可以直接看到它,而不会弄乱beta函数!点积的方差等于任何球坐标的方差(如您所写),并且所有和都应为,即QED1/DD1
变形虫表示2014年

1
关于差异,这是一个不错的观察。
ub

2
@amoeba,最近的活动也再次引起了我的注意,我很高兴您接受了我的回答,这一内容非常充实。如果您更改了,我根本不会介意。
ekvall

1
@ Student001:这是一个公正而慷慨的评论。我切换了接受的答案。我还找到了一个Q和一个A来弥补:)
变形虫说恢复莫妮卡

1
@mat的分布是。这使得它成为Beta分布,已从间隔缩放并转移到间隔。t2U1[0,1][1,1]
ub

11

让我们找到分布,然后方差跟随标准结果。考虑矢量乘积并将其写成余弦形式,即注意,我们有其中是和之间的夹角。在最后一步中,我将其用于所有事件和现在考虑项。显然,由于是相对于球体表面均匀选择的,因此无关紧要

P(xyt)=P(|x||y|cosθt)=P(cosθt)=EP(cosθty),
θxyAB
EP(AB):=E[E[χAB]]=EχA=P(A).
P(cosθty)xy实际上,只有和之间的角度很重要。因此,期望中的项实际上是常数,我们可以wlog假设然后我们得到但由于是所述第一归一化高斯矢量中的坐标 我们有是高斯与方差通过调用的渐近结果本文xyyy=[1,0,0,].
P(xyt)=P(x1t).
x1Rn,xy1/n

对于方差的显式结果,请使用以下事实:点积的独立性为零,并且如上所示,其分布类似于的第一个坐标。根据这些结果,找到等于找到。现在,请注意每个构造,因此我们可以写为其中最后一个等式来自的坐标均相同分布。放在一起,我们发现xVar(xy)Ex12xx=1

1=Exx=Ei=1nxi2=i=1nExi2=nEx12,
xVar(xy)=Ex12=1/n

谢谢,但我感到困惑:“期望的结果”到底是什么?从最后一个方程式得出的结果如何?最终的概率分布应取决于。D
变形虫说恢复莫妮卡2014年

实际上,最后一个等式的结果如何与您在math.SE线程上讨论的内容完全相同。它涉及beta分布等,并且限制行为(对我而言)远非显而易见。我想应该有看到最简单最直接的方式。σ2(D)1/D
变形虫说恢复莫妮卡2014年

由于,因此它确实取决于尺寸,其中是生成的高斯向量。我将在今天或明天晚些时候更新答案。x1=z1|z|1z
ekvall 2014年

哇,太好了,您的最后一个链接在第1页的第三个方程式中提供了包含反beta函数(我怕无法计算)的表达式的限制。因此,请完成以下推理:如果球体的半径为,然后被(渐近地)分布为。这意味着对于单位半径方差球体倍小,即。不过,我仍然有一个问题:我检查从1到4,似乎给出确切的差异,即使对于d = 1或d = 2的分布与正常的很远。这背后应该有更深层次的原因。Dx1N(0,1)D1/DD1/D
变形虫说莫妮卡恢复2014年

@amoeba是的,对此进行了更新。
ekvall 2014年

2

要回答问题的第一部分,请表示。定义 元素 的乘积的和在此表示为将根据的联合分布分布和。 然后从, Z=X,Y=XiYi

fZi(zi)=fZ1,,ZD(z1,,zD)dzi
ithXYZiXiYi
fZi(zi)=fXi,Yi(x,zix)1|x|dx
Z=Zi
fZ(z)=fZ1,,ZD(z1,,zd)δ(zzi)dz1dzd

对于第二部分,我认为,如果您想对的渐近行为说些有趣的话,则至少需要假定和独立性,然后应用CLT。σXY

例如,如果您愿意假设与和,则可以说和。{Z1,,ZD}E[Zi]=μV[Zi]=σ2σ2(D)=σ2DlimDσ2(D)=0


谢谢,但是我对第二部分感到困惑。和当然应该是独立的,我将其添加到问题中。您说,这听起来很合理,但是的渐近行为是什么?我想我在寻找表达应该仅仅依赖。顺便说一下,如果我没记错的话,在2D,我想知道这是否在更高维度上仍然适用……XYσ2(D)=Var(zi)/DVar(zi)DVar(zi)=1/2
阿米巴说2014年

考虑到和均为单位长度,是否真的可能独立?ziXY
ekvall 2014年

@汤姆:顺便,我错:在2D是1,它是等于1/2。我用一些模拟结果更新了我的问题。似乎是正确的公式为。Var(zi)Var(z)1/D
变形虫说恢复莫妮卡2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.