什么是图形嵌入?


13

我最近遇到了图嵌入,例如DeepWalk和LINE。但是,我仍然不清楚,因为图形嵌入是什么意思以及何时使用它(应用程序)?欢迎任何建议!


1
图嵌入是图的嵌入!因此,它需要一个图并返回图,边或顶点的嵌入。嵌入使能相似性搜索,并且通常通过提供表示来促进机器学习。
Emre

@Emre嵌入是什么意思?:)
Volka

1
随着嵌入含义的发展,将事物固定在某物上。图形嵌入有点像将顶点固定到曲面上并绘制边缘以表示网络。因此,举例来说,平面图可以嵌入到曲面上而无需边缘交叉。可以将权重分配给边缘,并分配适当的边缘长度。帮助我们为@Emre提到的相似性搜索等等了解/估计2D
Kiritee珏

@KiriteeGak谢谢:)他们在现实世界中有什么应用?他们说他们可以用于推荐等等?但是如何?
Volka

1
可以将YouTube视频推荐可视化为一个模型,其中,根据当前用户正在观看的视频是您所在的节点,而推荐的下一个视频则是与您最相似的视频(基于相似用户接下来观看的观看次数以及许多观看次数)当然还有更多因素需要遍历。纸是一种简单好理解上的应用程序读取。
Kiritee Gak '17

Answers:


19

图嵌入学习了从网络到向量空间的映射,同时保留了相关的网络属性。

向量空间比图形更适合数据科学。图包含边和节点,这些网络关系只能使用数学,统计和机器学习的特定子集。向量空间具有来自这些域的更丰富的工具集。此外,矢量运算通常比等效的图形运算更简单,更快。

一个例子是找到最近的邻居。您可以在图中的一个节点到另一个节点之间执行“跳跃”。在经过几次跃点后的许多现实世界图中,几乎没有有意义的信息(例如,来自朋友的朋友的推荐)。但是,在向量空间中,您可以使用距离度量来获取定量结果(例如,欧几里得距离或余弦相似度)。如果您在有意义的向量空间中具有定量的距离度量,那么找到最近的邻居将非常简单。

图形嵌入技术,应用程序和性能:调查 ”是一篇概述文章,其中有更详细的介绍。


26

什么是图嵌入? “图形嵌入”是当今机器学习的热门领域。从根本上讲,这意味着找到图的“潜在矢量表示”,该图捕获了图的拓扑结构(在非常基本的意义上)。我们还可以通过考虑顶点-顶点关系,边缘信息等来丰富“矢量表示”。图形中大约有两个层次的嵌入(当然,我们随时可以通过将整个图形逻辑划分为多个层次来定义更多层次各种大小的子图):

  • 顶点嵌入 -在这里您可以找到给定图中每个顶点的潜在矢量表示。然后,您可以通过在空间中绘制这些向量来比较不同的顶点,有趣的是,“相似”的顶点比不相似或相关性较小的顶点彼此靠近。这与Perozzi在“ DeepWalk”中所做的工作相同。
  • 图嵌入 -在这里您可以找到整个图本身的潜在矢量表示。例如,您有一组化合物要检查哪些化合物彼此相似,该组中有多少种化合物(簇)等。您可以使用这些向量在空间中绘制它们并绘制找到以上所有信息。这是Yanardag在“深层图形内核”中完成的工作。

应用- 通过仔细查看,嵌入是“潜在”表示,这表示图形是否具有| V |。* | V | 邻接矩阵,其中| V | = 1M,很难在算法中使用或处理1M * 1M数字。因此,维'd'的潜在嵌入(其中d << || V |)将使邻接矩阵| V |。* d且相对易于使用。另一个应用程序是-考虑一个简单的场景,我们想向对社交网络有相似兴趣的人们推荐产品。通过获取顶点嵌入(此处表示每个人的矢量表示),我们可以通过绘制这些矢量来找到相似的矢量,从而使推荐变得容易。这些是一些应用程序,还有其他应用程序。您可以参考一份不错的调查论文-Graph Embedding Techniques,Survey

一切从何而来?这个领域有很多作品,而且几乎全部来自自然语言处理领域的开创性研究-Mikolov的“ Word2Vec”。如果您想开始图嵌入的研究,建议您先了解Word2Vec的工作原理。您可以找到不错的解释-Word2Vec参数学习Stanford讲座。然后,您可以跳至列出的论文。这些作品可以归类为:


2
哇!!这绝对是一个完美的答案。非常感谢:)做得很好:)
Volka

嗨,毛萨姆·in那。您能否让我知道是否可以使用图形嵌入来识别网络中的重要节点?
Volka

嗨,沃尔卡 要回答这个问题,我需要知道您正在处理哪种类型的图。是twitter,facebook,reddit还是其他?
flyingDope

谢谢您的回复。我实际上是在一个社交网络中工作,我想找出最社交的人:)
Volka

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.