什么是歧管?


28

在降维技术(例如主成分分析,LDA等)中,经常使用术语歧管。非技术术语是什么?如果点属于我要减小尺寸的球体,并且存在噪声且和不相关,则实际点会由于噪声而彼此分离。因此,将需要噪声过滤。因此,将在上执行尺寸缩减。因此,在这里和属于不同的流形吗?xyxyxz=x+yxy

我正在处理机器人视觉中经常使用的点云数据;由于采集中的噪声,点云很吵,我需要在减小尺寸之前减小噪声。否则,我会得到不正确的尺寸缩小。那么,这里的流形是什么?噪声是属于同一流形的一部分吗?x


4
在数学上
不精确的

Answers:


45

用非技术术语来说,流形是具有有限尺寸的连续几何结构:直线,曲线,平面,表面,球体,球,圆柱体,圆环,“斑点” ...类似这样的东西: 在此处输入图片说明

它是数学家用来表示任何可能的有限维 “曲线”(维度1)或“曲面”(维度2)或3D对象(维度3)的通用术语。一维流形仅仅是一条曲线(直线,圆...)。二维流形只是一个表面(平面,球体,圆环面,圆柱面...)。三维流形是一个“完整的对象”(球,完整的立方体,我们周围的3D空间...)。n

流形通常用等式描述:点的集合例如是一维流形(一个圆)。(x,y)x2+y2=1

歧管到处都具有相同的尺寸。例如,如果将线(尺寸1)附加到球体(尺寸2),则生成的几何结构不是流形。

与度量空间或拓扑空间的更一般概念(也旨在描述我们对一组连续点的自然直觉)不同,流形旨在局部简化:像有限维向量空间:。这排除了抽象空间(例如无限维空间),这些空间通常没有几何上的具体含义。Rn

与向量空间不同,流形可以具有各种形状。一些歧管可以很容易地可视化(球体,球等),而有些则很难可视化,例如克莱因瓶真实的投影平面

在统计,机器学习或一般应用数学中,单词“歧管”通常用来表示“像线性子空间”,但可能是弯曲的。每当您编写一个线性方程式:您都会得到一个线性(仿射)子空间(这里是一个平面)。通常,当方程是非线性的,例如,这是一个流形(此处是拉伸球体)。3x+2y4z=1x2+2y2+3z2=7

例如,ML 的“ 流形假设 ”说:“高维数据是添加了高维噪声的低维流形中的点”。您可以想象添加了一些2D噪声的1D圆的点。尽管这些点不完全在圆上,但它们在统计上满足方程。圆是基础流形: x2+y2=1https://i.stack.imgur.com/iEm2m.png


4
@RiaGeorge在图片中,表面是一个流形。这是连续,因为你可以四处自由移动而不会中断,从来没有跳表面的任何两两地之间就搞定了。暗示的孔对于描述如何以最简单的方式在任意两点之间的表面上走线很重要,对孔进行计数是研究流形的一项重要技术。
马修·德鲁里

4
解释什么拓扑对于这个站点来说可能是一个太宽泛的问题,而且有点离题。我会在数学堆栈交换中搜索有关此信息。流形和拓扑不是同义词:流形是使用拓扑技术研究的数学对象,拓扑是数学的一个子主题。
马修·德鲁里

1
答案错过了构成此类问题的所有基本要点,我不知道它有多少支持。甚至没有提到拓扑,图表和平滑度,答案基本上给人的印象是流形是一个表面,而曲面不是
gentil '17

2
技术要点,方程组的解集不必是流形。它是多种多样的,因此主要是流形,但是在流形属性失败的情况下,它可以具有自交点。
马特·塞缪尔

1
您的流形定义包括对有限尺寸的要求。但是,您将包含不满足该要求的示例,例如直线,平面,曲线和曲面。您能说明一下您的意思吗?
Mowzer '17

13

(拓扑)流形是一个空间,它是:M

(1)对于一些 “本地”“等同于”。Rnn

“局部性”可以通过坐标函数,它们一起形成一个“结构保留”函数,称为图表nci:MRc:MRn

(2)可以“保留结构”的方式实现为的的子集。(1)(2)RNNn

需要注意的是,为了使“结构”在这里精确,一个需要了解的基本概念拓扑结构DEF。 ),它允许一个做出精确的概念“本地”行为,从而“本地”上面。当我说“等效”时,我是指等效的拓扑结构(同胚),当我说“结构保留”时,我是指同一件事(创建等效的拓扑结构)。

还要注意,为了在流形进行微积分,需要一个附加条件,该条件不能满足上述两个条件,这基本上是说“诸如图表足以使我们进行微积分”之类的事情。这些是实际中最常用的歧管。与一般拓扑流形不同,除演算外,它们还允许进行三角剖分,这在像您这样的涉及点云数据的应用程序中非常重要

请注意,并非所有人都对(拓扑)歧管使用相同的定义。几位作者将其定义为仅满足上述条件(1),而不一定满足(2)。但是,同时满足(1)和(2)的定义表现得更好,因此对从业者更有用。可能会直观地期望(1)暗示(2),但实际上并非如此。

编辑:如果你有兴趣学习什么恰恰是“拓扑”是,拓扑了解的最重要的例子是欧几里德拓扑的。这将在任何有关“真实分析”的(良好)入门书籍中进行深入介绍。Rn


谢谢您的回答:您能否以非技术术语解释拓扑是什么?拓扑和歧管一词可互换使用吗?尺寸必须是整数吗?它是一个实数,那么我认为如果整个结构都是由每个子部分组成的,则该结构称为分形。
Ria George

1
@RiaGeorge代表自然数(整数),也是如此。对于分数/实值维度,可能会有更高级的理论,但是它并不经常出现。“拓扑”和“歧管”是两个非常不同的事物,因此它们不是可互换的术语。“歧管”具有“拓扑”。拓扑领域研究具有“拓扑”的空间,这些空间是满足三个规则/条件的集合的集合。研究“拓扑”的一个目标是以一致和可复制的方式描述“局部”行为的概念。n1N
Chill2Macht

@RiaGeorge可以在Wikipedia页面上找到“拓扑”的公理:en.wikipedia.org/wiki/General_topology#A_topology_on_a_set-还要注意,我给您提供的(等效)术语“拓扑”的链接的邻居指出了相关但不相同的事物,我编辑了答案以反映这一点:en.wikipedia.org/wiki/…但是请注意,关于邻居的定义更难以理解(我想我可以理解好吧,但我也不必打扰,因为我很懒
Chill2Macht

因此,无论如何,这是我个人的偏见,您不需要了解拓扑的邻域定义-只需知道更简单的定义就可以严格描述局部行为,就可以为您提供邻域定义的所有相同功能,因为它们是当量)。无论如何,如果您对分形感兴趣,也许您会发现这些Wikipedia页面很有趣-但是我无法为您提供更多帮助,因为我对这一理论并不十分了解,并且不了解或不了解其中的大部分内容。定义-我只听说过一些
Chill2Macht

1
这是到目前为止唯一关注从本地数据组装全局对象的现代数学思想的答案。不幸的是,它并没有达到“非技术”帐户所要求的简单性和清晰度。
whuber

9

在这种情况下,术语“歧管”是准确的,但不必要是高脂肪酸盐。从技术上讲,流形是指足够平滑且连续的任何空间(带有拓扑的点集)(通过某种方式可以在数学上明确定义)。

想象一下原始因子所有可能值的空间。使用降维技术后,并非该空间中的所有点都是可到达的。取而代之的是,只能获得该空间内某个嵌入式子空间上的点。该嵌入式子空间恰好满足流形的数学定义。对于诸如PCA的线性降维技术,该子空间只是一个线性子空间(例如,超平面),这是一个相对琐碎的流形。但是对于非线性降维技术,该子空间可能会更复杂(例如,曲面超曲面)。出于数据分析的目的,了解这些是子空间比知道它们满足流形的定义所得出的任何推论都重要得多。


3
“ Highfalutin” ...今天学会了一个新词!
Mehrdad

5
数学上,流形是任何局部连续的拓扑空间。我喜欢尝试用通俗易懂的语言解释事物的想法,但是这种表征确实行不通。首先,连续性始终是本地属性,因此我不确定您所说的本地连续性是什么意思。同样,您的定义不能排除很多不是流形的东西,例如有理数线或欧几里得平面中两条相交线的并集。
本·克洛威尔

4
我同意Ben,从技术上讲,它是“本地欧几里得”。我不确定是否有将其简化为简单英语的好方法。
马修·德鲁里

1
我还必须强烈同意以上两个评论。实际上,我在下面写的答案原本是对此答案的澄清评论,而答案却太长了。没有“连续”拓扑空间的精确概念(请参见此处:math.stackexchange.com/questions/1822769/…)。我认为,从长远来看,用不存在的概念来定义流形比起澄清更容易造成混淆。至少,我建议将第一句话中的“数学上”一词替换为其他内容。
Chill2Macht

我将以此评论为契机提出一个小问题……我(认为)我有了流形的想法,但是为什么它需要“本地化”?空间不是“局部”连续的...整体上连续的吗?
Paul92年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.