因为(众所周知)通过对变量正态分布进行归一化而获得了单位球面上的均匀分布, 并且归一化向量的点积是它们的相关系数,所以这三个问题的答案问题是:SD−1Dt
u=(t+1)/2具有Beta分布。((D−1)/2,(D−1)/2)
的方差等于(如问题所推测)。t1/D
的标准化分布以的速率接近正态tO(1D).
方法
容易从几何上轻松获得单位矢量点积的精确分布,因为这是第二个矢量在第一个方向上的分量。由于第二矢量与第一矢量无关,并且均匀地分布在单位球体上,因此它在第一方向上的分量与球体的任何坐标相同地分布。(请注意,第一个向量的分布无关紧要。)
求密度
因此,以该坐标为最后一个坐标,处的密度与单位球面上位于到之间的高度的表面积成比例。该比例出现在高度为且半径为这实际上是由半径为的构成的圆锥形截头锥体的高度和斜率。概率与t∈[−1,1]tt+dtdt1−t2−−−−−√,SD−21−t2−−−−−√,dt1/1−t2−−−−−√
(1−t2−−−−−√)D−21−t2−−−−−√dt=(1−t2)(D−3)/2dt.
令意味着。将其替换为前面的值将使概率元素达到归一化常数:u=(t+1)/2∈[0,1]t=2u−1
fD(u)du∝(1−(2u−1)2)(D−3)/2d(2u−1)=2D−2(u−u2)(D−3)/2du.
立即具有Beta分布,因为(根据定义)其密度也与u=(t+1)/2((D−1)/2,(D−1)/2)
u(D−1)/2−1(1−u)(D−1)/2−1=(u−u2)(D−3)/2∝fD(u).
确定极限行为
使用基本技术可以很容易地从中获得有关极限行为的信息:可以集成以获得比例常数 ; 可以积分(例如,使用Beta函数的属性)以获得矩,从而表明方差为并缩小为(因此,根据切比雪夫定理,该概率变得集中于附近)); 然后通过考虑标准化分布的密度值(与成正比)来分布。fDΓ(n2)π√Γ(D−12)tkfD(t)1/D0t=0fD(t/D−−√),t:
log(fD(t/D−−√))=C(D)+D−32log(1−t2D)=C(D)−(1/2+32D)t2+O(t4D)→C−12t2
其中代表积分的(对数)常数。显然,接近常态的速度(对数密度等于)的比率为C−12t2O(1D).
该图显示了标准化为单位方差的 4、6、10的点积的密度及其极限密度。处的值随增大(对于标准法线密度,从蓝色到红色,金色和绿色)。在此分辨率下,的密度与正常密度是无法区分的。D=4,6,100DD=1000