Answers:
用非技术术语来说,流形是具有有限尺寸的连续几何结构:直线,曲线,平面,表面,球体,球,圆柱体,圆环,“斑点” ...类似这样的东西:
它是数学家用来表示任何可能的有限维 “曲线”(维度1)或“曲面”(维度2)或3D对象(维度3)的通用术语。一维流形仅仅是一条曲线(直线,圆...)。二维流形只是一个表面(平面,球体,圆环面,圆柱面...)。三维流形是一个“完整的对象”(球,完整的立方体,我们周围的3D空间...)。
流形通常用等式描述:点的集合例如是一维流形(一个圆)。
歧管到处都具有相同的尺寸。例如,如果将线(尺寸1)附加到球体(尺寸2),则生成的几何结构不是流形。
与度量空间或拓扑空间的更一般概念(也旨在描述我们对一组连续点的自然直觉)不同,流形旨在局部简化:像有限维向量空间:。这排除了抽象空间(例如无限维空间),这些空间通常没有几何上的具体含义。
与向量空间不同,流形可以具有各种形状。一些歧管可以很容易地可视化(球体,球等),而有些则很难可视化,例如克莱因瓶或真实的投影平面。
在统计,机器学习或一般应用数学中,单词“歧管”通常用来表示“像线性子空间”,但可能是弯曲的。每当您编写一个线性方程式:您都会得到一个线性(仿射)子空间(这里是一个平面)。通常,当方程是非线性的,例如,这是一个流形(此处是拉伸球体)。
例如,ML 的“ 流形假设 ”说:“高维数据是添加了高维噪声的低维流形中的点”。您可以想象添加了一些2D噪声的1D圆的点。尽管这些点不完全在圆上,但它们在统计上满足方程。圆是基础流形:
(拓扑)流形是一个空间,它是:
(1)对于一些 “本地”“等同于”。
“局部性”可以通过坐标函数,它们一起形成一个“结构保留”函数,称为图表。
需要注意的是,为了使“结构”在这里精确,一个需要了解的基本概念拓扑结构(DEF。 ),它允许一个做出精确的概念“本地”行为,从而“本地”上面。当我说“等效”时,我是指等效的拓扑结构(同胚),当我说“结构保留”时,我是指同一件事(创建等效的拓扑结构)。
还要注意,为了在流形上进行微积分,需要一个附加条件,该条件不能满足上述两个条件,这基本上是说“诸如图表足以使我们进行微积分”之类的事情。这些是实际中最常用的歧管。与一般拓扑流形不同,除演算外,它们还允许进行三角剖分,这在像您这样的涉及点云数据的应用程序中非常重要。
请注意,并非所有人都对(拓扑)歧管使用相同的定义。几位作者将其定义为仅满足上述条件(1),而不一定满足(2)。但是,同时满足(1)和(2)的定义表现得更好,因此对从业者更有用。可能会直观地期望(1)暗示(2),但实际上并非如此。
编辑:如果你有兴趣学习什么恰恰是“拓扑”是,拓扑了解的最重要的例子是欧几里德拓扑的。这将在任何有关“真实分析”的(良好)入门书籍中进行深入介绍。
在这种情况下,术语“歧管”是准确的,但不必要是高脂肪酸盐。从技术上讲,流形是指足够平滑且连续的任何空间(带有拓扑的点集)(通过某种方式可以在数学上明确定义)。
想象一下原始因子所有可能值的空间。使用降维技术后,并非该空间中的所有点都是可到达的。取而代之的是,只能获得该空间内某个嵌入式子空间上的点。该嵌入式子空间恰好满足流形的数学定义。对于诸如PCA的线性降维技术,该子空间只是一个线性子空间(例如,超平面),这是一个相对琐碎的流形。但是对于非线性降维技术,该子空间可能会更复杂(例如,曲面超曲面)。出于数据分析的目的,了解这些是子空间比知道它们满足流形的定义所得出的任何推论都重要得多。