随机图模型,用于真实计算机网络


19

我对与真实计算机网络图相似的随机图模型感兴趣。我不确定通用的经过充分研究的模型(n个顶点,每个可能的边均以概率p选择)是否适合研究真实的计算机网络(是吗?)。G(n,p)np

哪种随机图模型对理解计算机网络在实践中有用?

更一般而言,文献中还研究了其他哪些有限随机图模型(与模型等效的模型除外)?(一个理想的答案是对有限随机图的研究模型进行调查的指针。)G(n,p)


2
您在哪里需要这样的模型-仅仅是为算法生成一些测试输入,还是想分析模型以了解有关计算机网络的知识?您对哪种计算机网络感兴趣?您的规模是多少(局域网还是互联网)?您为什么假设真实的计算机网络是由随机过程生成的?令人惊讶的是,现实世界中的网络实际上是由工程师设计的,投入的硬币很少?
Jukka Suomela 2011年

@Jukka,我试图查看是否可以将针对开发的技术应用于这些随机模型,以获取有关真实网络的信息,我现在不想更具体,因为它可能会给解决我正在考虑的问题:)。我主要对Internet的IP层感兴趣。我已经看到人们使用随机图来分析社交网络产生的图。我不确定为什么这些真实的网络与随机图共享属性,工作表面背后可能存在一个隐藏的随机过程(这似乎是一个有趣的问题:)。Gñp
卡夫

我猜想使用随机模型的部分兴趣在于,分析它们比分析实际网络更容易,因此,如果它们与真实网络足够近似,则考虑它们是合理的。
卡夫

谢谢大家的好评。(现在我必须花一些时间阅读这些论文。:)
Kaveh

Answers:


10

在过去的几年中,具有“自然”结构约束的随机图的研究获得了关注。例如,可以考虑从具有个顶点的所有平面图的类中绘制的平面图,并研究其行为为n 。与Erdős-Rényi随机图或其他类似模型不同,这些图中的边缘高度依赖,因此研究此类分布的伪动机之一是分析边缘之间非常有限的独立性的网络模型。ñn

但是,由于有限的独立性使得分析此类图的属性变得更加困难,因此当前的目标似乎还很遥远。实际上,对于很容易回答的几个基本问​​题,例如度数序列的分布,最近才才针对随机平面图解决。G(n,p)

有关确定的参考,请参见Konstantinos Panagiotou的论文及其中的引用。为了方便起见,以下是一些相关论文的小样本:

  • 关于随机平面图的度分布Konstantinos Panagiotou和Angelika Steger。出现在第22届ACM-SIAM离散算法年度研讨会论文集(SODA '11)中。
  • 关于随机解剖和三角剖分的性质Nicla Bernasconi,Konstantinos Panagiotou和Angelika Steger。在第19届ACM-SIAM离散算法年度研讨会论文集(SODA '08)中,第11页。132-141。[http://www.mpi-inf.mpg.de/~kpanagio/Dissections.pdf]
  • 关于随机外平面图和级数平行图的度序列Nicla Bernasconi,Konstantinos Panagiotou和Angelika Steger。在第十二届国际随机计算技术研讨会论文集(RANDOM'08)中,第1页。303-316。[http://www.mpi-inf.mpg.de/~kpanagio/OPSP.pdf]

1
另一条评论:这条研究线实际上可以追溯到15年前,至少是Denise,Vasconcellos和Welsh(1996)的论文,它之所以获得“牵引力”的一个原因是该技术的巨大成功。解析组合和渐近枚举,例如Gimenez和Noy(2009)。
RJK

10

这项由Newman撰写的复杂网络的结构和功能的调查,回顾了实际复杂网络的技术和模型,其中包括小世界效应,度分布和随机图模型等概念。同样,同一位作者有一篇不错的论文,即《随机图作为网络模型》,关于将随机图改编成真实网络的模型。

参考文献:

1)随机图作为网络模型,MEJ Newman,《图形和网络手册》,S。Bornholdt和HG Schuster(ed。),Wiley-VCH,柏林(2003)

2)复杂网络的结构和功能,MEJ Newman,SIAM评论45,167-256(2003)


1
只是好奇:这是“社交”网络还是互联网?
Suresh Venkat

我第二点:社交网络的方法应该非常有用,因为对这些网络的许多研究最初都集中在网络的“通用”属性上,包括神经拓扑,电网和道路网络。此外,Barabasi-Albert和瓦-斯托加茨网,每个属性,真正的网络已经和鄂尔多斯-仁义忽略,非常非常非常充分研究
埃利奥特JJ

1
@Suresh,两个参考文献中都涉及的那些复杂网络包括计算机网络,例如Internet和社交网络。
Mohammad Al-Turkistany

8

真正的计算机网络在哪一层?在AS级别(可以说是最高级别),Internet是一个具有一些高度节点的小型世界网络。随着各层与实际线路的距离越来越近,图表变得与地理联系更多,而与社交层联系更少(社交是一个错误的词-当作为“朋友”的实体是跨国公司时,它真的是社交网络吗?) 。在极端情况下,本地以太网是一棵逻辑树,(可能)是电线连接的物理模式的子图,并且电线连接的模式可能只不过是一棵树而已。

“真实的计算机网络”具有多种风格和层次。他们中有些看起来像社交网络,有些则不然。有关更多信息,我不建议您参考论文的第二章-http: //home.manhattan.edu/~peter.boothe/thesis.pdf


我主要对物理网络(例如IP层)感兴趣。感谢您的链接,我将对其进行检查。
卡夫

2
IP层不是物理层。MPLS和其他电路交换技术打破了这一假设。物理层是电线。我们甚至有似乎是单以太网跳的多线链路!“什么层”这个问题比第一次检查可能提出的要深,需要仔细考虑。我建议您考虑一下网络可能想要的属性,找到拓扑分析最能帮助您分析该属性的层,并希望有可用的数据。
Peter Boothe


5

沃尔特·威林格(Walter Willinger)的职业生涯是使用无标度图对网络进行建模。有太多要引用的内容,因此,我将向您介绍他的DBLP条目。这些模型的关键点是它们具有类似于G(n,p)未捕获的“真实”网络的属性。



5

与其费力地寻找,证明和分析特定模型,不如要使用所拥有的实际数据(如果有的话)。这意味着定义一个通用的概率模型并根据您的数据训练其参数(例如,通过最大似然估计)。

例如,您可以描述树木的SCFG(例如 小号p1个小号小号p2ε)并分配概率(p1个p2),以您的现实生活数据集中的相对发生率为依据,可证明会产生MLE。您甚至可以使用内-外算法训练概率。另外,您甚至可以为模型提供简洁的说明,该说明可以用于各种分析中。

显然,特定的语法可以(并且应该!)使用领域知识。考虑一下在Dowell,Eddy(2004)中用于RNA二级结构预测的不同语法。

Weinberg,Nebel(2010)中找到有关此技术的一些详细信息。但是,我不知道如何(很好)将其应用于一般图形。

如果您需要更多功能,则可以使用多维(S)CFG(例如Seki,Kato(2008))或依赖于长度/位置的SCFG(Weinberg,Nebel(2010))。


1
这很酷,但是SCFG的上下文无关性质是否会迫使您的学习者忽略训练集中的网络可能具有的某些全局结构?
Artem Kaznatcheev

是的,非上下文无关的功能会丢失。但请注意,可以捕获诸如(平均)节点度之类的属性。有关更多信息,请参见我的编辑。
拉斐尔

谢谢!我会仔细看看。隐藏的MDP是否也可以捕获平均程度之类的属性?似乎应该可以用常规语言来捕捉某种东西,还是我感到困惑?(还有一点要注意:Weinberg,Nebel链接的末尾字符会杀死该链接,很明显,您打算使用哪个链接,但是,如果进行更多编辑,则可能值得修复)。
Artem Kaznatcheev

当然,我只想指出,您可以使用该模型涵盖一些全局特征。REG也可以涵盖某些内容,但是将无法对固有的非规则结构进行建模。(感谢,已修复)
拉斐尔,

3

使用Erdos-Renyi随机图的问题(Gñp 要么 Gñ)是他们遵循的是Poisson度分布,这给了他们有限的第二矩。许多现实世界的图形,包括“ Web图形”或“ Internet图形”,往往不遵循这种程度分布,而是倾向于在第二时刻具有更大的可变性的程度分布。我认为,其中最大的差异之一就是它们中许多具有的幂律度分布。例如,请参阅随机网络中缩放的出现

您可能知道,万维网的连接图与Internet基础结构的连接图之间似乎有所不同。我当然不声称自己是专家,但是我看到Li,Alderson,Tanaka,Doyle和Willinger的论文“迈向无标度图理论:定义,属性和含义”介绍了S-metric来衡量图的“无标度”(据我所知,标度图的定义仍在争论中),声称有一个图模型可以创建类似于路由器互联网连接的图水平。

以下是一些可能有趣的生成模型:

Berger,Borgs,Chayes,D'​​Souza和Kleinberg的论文“竞争诱导的优惠依恋”

卡尔森和道尔的高度优化容差:设计系统中的功率定律机制

Molloy和Reed的“具有给定度数序列的随机图的临界点 ”介绍了“擦除配置模型”

成长网络中的纽曼集群和优先连接(已经提到)

也可以通过这种方式显式生成度分布并创建图,但是我不清楚这种方法在路由器级别对互联网图建模的接近程度。

当然,关于该主题的文献更多,而我仅给出了一些重点(我认为是重点)。

据我了解,许多结果适用于随机图的Erdos-Renyi模型(Gñp 要么 Gñ)不能精确地工作,因为无标度或幂律度数分布的随机图在度数分布中发散了第二矩。我并没有声称对这个主题有足够的了解来对“大多数”证明进行断言,但是从我所看到的来看,鄂尔多斯-仁尼随机图上属性的最初几行证明之一明确地假设一个有限的度分布中的第二个时刻。从我的角度来看,这是有道理的,因为有限的第二时刻使鄂尔多斯-仁义图更像树状图(请参阅Mertens和Montanari的信息,物理学和计算),从而有效地赋予属性/路径/结构独立性。由于幂律度分布的随机图具有发散的第二矩,所以这种局部树状结构被破坏(因此需要不同的证明技术?)。如果有更多知识或洞察力的人表明为什么事实并非如此,我很乐意使这种直觉失效。

希望能有所帮助。


3

尽管这是一个古老的话题,但由于许多人仍在访问此类帖子,所以我要答复。我从另一个回复中的评论中得到了动力。

已经提出了Barabasi-Albert模型和其他产生无标度图的模型,以在路由器级别和自治系统级别对Internet进行建模。尽管最初这类模型被认为是准确的,但事实证明,由于难以发现所有链接,我们没有完整的Internet拓扑图。尽管它被认为是沉重的尾巴,但仍在进行中。

供您参考,您可以阅读:RG Clegg,C Di Cairano-Gilfedder,S Zhou,对Internet幂定律建模的批判性观察


2

有几本关于随机图的书,例如Bollobás的书,并且有几种随机图模型,例如小世界Wikipedia的链接或优先附件Wikipedia的链接,它们可以模拟计算机之间距离较小的网络或遵循幂律进行度分布的网络, 分别。

我认为没有一种简单的方法可以对真实的计算机网络进行建模,但是我很确定G(n,p)不能很好地对其进行建模。除非您使用的是非常具体的有组织的网络。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.