当我们说超立方体中的大多数点都在边界处时,这意味着什么?


13

如果我有一个50维的超立方体。我用0.95 < x j < 1定义边界,其中x j是超立方体的尺寸。然后计算超立方体边界上的点比例为0.995。这是什么意思?这是否意味着其余空间是空的?如果99 的点位于边界处,那么立方体内的点一定不能均匀分布吗?0<xj<0.050.95<xj<1xj0.99599%


3
不,这意味着外围更宽敞,并且效果与尺寸相称。这有点违反直觉。这种现象会对节点的随机对之间的距离分布产生影响,当您要在高维空间中聚类或计算最近的邻居时,节点对之间的距离会变得很重要。
Emre

计算线段上点的比例接近其边界。然后指向一个正方形。然后指向一个立方体。您能对他们说些什么?
user253751 '18

Answers:


28

说到“ 超立方体中99%的点 ”有点误导,因为超立方体包含无限多个点。让我们来谈谈音量。

Total volume=1×1××150 times=150=1.

x=(x1,x2,,x50)

0.05<x1<0.95 and 0.05<x2<0.95 and  and 0.05<x50<0.95.
0.9=0.950.05
Interior volume=0.9×0.9××0.950 times=0.9500.005.
10.9500.995.

99.5%


后续行动: 伊格纳蒂乌斯就这与概率之间的关系提出了一个有趣的问题。这是一个例子。

01

0.050.950.050.95

10%5010.9500.995.99.5%

经验法则: 在高维度上,极端观察是规则,并非例外。


7
值得使用OP的报价“这是否意味着剩余空间是空的?” 并回答:不,这意味着其余空间相对较小 。。。或用您自己的话说类似。。。
尼尔·斯莱特

2
关于“维数诅咒”一词的解释非常好
ignatius

想知道以下内容是否正确:以本示例为例,如果一组特征在50个维度中的每个维度上均沿[0,1]均匀分布,则(99.5%-0.5%)=体积的​​99%(超立方体特征)空间)仅捕获每个功能的10%值
ignatius

“任何给定的输入参数都是极端的,概率只有5%。” 我认为这个可能性是10%。
罗德维

@Rodvi:您当然是对的,谢谢!固定它。
Elias Strehle

9

即使在较小尺寸下,您也可以清楚地看到图案。

第一维。取一条长度为10且边界为1的线。边界的长度为2,内部的比率为8:1:4。

第二维。取边10的平方,再取边界1。边界的面积为36,内部为64,比例为9:16。

第三维。长度和边界相同。边界的体积为488,内部的体积为512,61:64-边界已经几乎占据了内部的空间。

第四维,现在边界是5904,内部边界4096-边界现在更大。

即使边界长度越来越小,随着尺寸的增加,边界体积将始终超过内部。


0

“理解”它的最佳方法(尽管对人类而言恕我直言是不可能的)是比较n维球和n维立方体的体积。随着n(维度)的增长,所有球的体积都会“泄漏”并集中在立方体的角上。这是在编码理论及其应用中要记住的有用的通用原理。

对此最好的教科书解释是在理查德·汉明(Richard W. Hamming)的书“编码和信息论”中(3.6几何方法,第44页)。

如果您牢记n维单位立方的体积始终为1 ^ n ,则Wikipedia中简短文章将为您提供相同内容的简短摘要。

希望对您有所帮助。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.