我最近遇到了图嵌入,例如DeepWalk和LINE。但是,我仍然不清楚,因为图形嵌入是什么意思以及何时使用它(应用程序)?欢迎任何建议!
我最近遇到了图嵌入,例如DeepWalk和LINE。但是,我仍然不清楚,因为图形嵌入是什么意思以及何时使用它(应用程序)?欢迎任何建议!
Answers:
图嵌入学习了从网络到向量空间的映射,同时保留了相关的网络属性。
向量空间比图形更适合数据科学。图包含边和节点,这些网络关系只能使用数学,统计和机器学习的特定子集。向量空间具有来自这些域的更丰富的工具集。此外,矢量运算通常比等效的图形运算更简单,更快。
一个例子是找到最近的邻居。您可以在图中的一个节点到另一个节点之间执行“跳跃”。在经过几次跃点后的许多现实世界图中,几乎没有有意义的信息(例如,来自朋友的朋友的推荐)。但是,在向量空间中,您可以使用距离度量来获取定量结果(例如,欧几里得距离或余弦相似度)。如果您在有意义的向量空间中具有定量的距离度量,那么找到最近的邻居将非常简单。
“ 图形嵌入技术,应用程序和性能:调查 ”是一篇概述文章,其中有更详细的介绍。
什么是图嵌入? “图形嵌入”是当今机器学习的热门领域。从根本上讲,这意味着找到图的“潜在矢量表示”,该图捕获了图的拓扑结构(在非常基本的意义上)。我们还可以通过考虑顶点-顶点关系,边缘信息等来丰富“矢量表示”。图形中大约有两个层次的嵌入(当然,我们随时可以通过将整个图形逻辑划分为多个层次来定义更多层次各种大小的子图):
应用- 通过仔细查看,嵌入是“潜在”表示,这表示图形是否具有| V |。* | V | 邻接矩阵,其中| V | = 1M,很难在算法中使用或处理1M * 1M数字。因此,维'd'的潜在嵌入(其中d << || V |)将使邻接矩阵| V |。* d且相对易于使用。另一个应用程序是-考虑一个简单的场景,我们想向对社交网络有相似兴趣的人们推荐产品。通过获取顶点嵌入(此处表示每个人的矢量表示),我们可以通过绘制这些矢量来找到相似的矢量,从而使推荐变得容易。这些是一些应用程序,还有其他应用程序。您可以参考一份不错的调查论文-Graph Embedding Techniques,Survey。
一切从何而来?这个领域有很多作品,而且几乎全部来自自然语言处理领域的开创性研究-Mikolov的“ Word2Vec”。如果您想开始图嵌入的研究,建议您先了解Word2Vec的工作原理。您可以找到不错的解释-Word2Vec参数学习和Stanford讲座。然后,您可以跳至列出的论文。这些作品可以归类为:
基于“图嵌入”的工作:- 深图内核,Subgraph2Vec。
在本文中,Levin等人的随机点积图的整体嵌入的中心极限定理。在论文中,一种特定类型的图嵌入(Omnibus嵌入)将图嵌入定义为一种方法“将图的顶点映射到低维欧氏空间中的向量”。检查链接以获取更多信息。