统计上真实网络/图形中的所有边缘偶然发​​生的可能性是什么意思?


11

我一直在使用本文概述的骨干网提取方法:http : //www.pnas.org/content/106/16/6483.abstract

基本上,作者提出了一种基于统计的方法,该方法为图形中的每个边产生概率,该边可能只是偶然发生。我使用的典型统计显着性临界值为0.05。

我一直在将这种方法应用于多个现实世界的网络,有趣的是,某些网络最终没有任何重要的优势。我试图了解这对网络意味着什么。我将方法应用于网络并且没有出现任何明显边缘的唯一一次是当我将方法应用于生成的随机网络时,这正是我们所期望的。

作为一个现实世界网络的示例,您可能已经看到《经济学人》上最近的网络可视化,显示了过去25年美国参议院的两极分化:http//www.economist.com/news/united-states/21591190 -united态阿米巴原虫。我将骨干网提取方法应用于这些网络,并且没有出现明显的边缘。即使原始边缘显然显示出优先的附着和聚类,这仅仅是偶然吗?参议院投票网络基本上是随机的吗?

Answers:


6

骨干方法背后的零假设是

对应于度数为k的某个节点的连接的归一化权重是通过均匀分配中的随机分配产生的。

如果没有任何“显着”边缘,则对整个图都使用零假设,即,边缘权重是由节点发送和接收关系的倾向导致的。

根据您正在分析的关系,骨干方法可能不合适。该方法最适合概念上为单模式加权网络的网络。可以将二模网络投影为加权的一模网络,但是这样做通常没有任何意义。

根据您在《经济学人》中的示例,将参议院投票分析为由共享投票数加权的单模网络是没有意义的。参议院投票是一种签署的两模式关系。参议员(i)与某项立法(j)有关系,他们要么弃权(0),要么投票赞成(+1)或反对(-1)立法。将网络转换为加权的单模协议网络,然后对其进行骨干分析将严重减少数据量。有些立法在政治上更具分裂性,而有些则比其他立法有更多选票—骨干方法无法抓住这些机制。

您可能需要考虑条件统一图(CUG)测试,而不是骨干方法。这些测试背后的想法是确定某些图级属性(例如,聚类,平均路径长度,居中,同构)是否是偶然产生的。流程如下:

  1. 从观察到的图形中获取测量值f
  2. 生成随机图,以控制观察图的某些属性(例如,大小,边数,度分布等)
  3. 从随机图中获取测量值f
  4. 重复步骤2和3多次(例如1000次)以产生空分布
  5. 将观察到的测量结果与零分布进行比较

对于双模网络,通过置换观察到的图来创建随机图是有意义的(R中的tnet和statnet都有用于置换双模网络的例程)。如果测量f需要一模态网络,则在将其投影为一模态网络之前,应在二模态网络上进行随机化处理。


4

在您引用的文章中,作者认为,在一个复杂的网络中,“ [这些节点代表[模型]系统的元素,并且加权边标识了交互的存在及其相对强度”(我强调) 。

在您研究的网络中,如果我对《经济学人》的文章理解正确,那么如果两位参议员至少同样投票100次,他们之间就有联系。因此,链接不会为互动建模,而是为相似性建模(参议员之间的投票行为)。根据我的经验,在某种意义上说,相似性网络不像交互网络那样表现出不同程度的分布。另外,提取网络时使用的阈值参数(此处为100)有时会对度分布产生很大影响。

而且,我在《经济学人》的文章中找不到提及任何权重的内容。然而,权重的存在似乎是ÁngelesSerrano 等人的工作中描述的方法中的重要点。你在问你的问题。

从这两个观察结果来看,由于该方法并非旨在处理这种类型的网络,因此似乎无法对这些数据准确执行。也许您可以检查度数分布:它是集中在特征值上还是异类?那重量呢?


我自己从源Web站点复制了数据,因此我包含了权重并且未应用任意截止阈值。因此,我认为应用主干方法的数据不应受到这些问题的影响。检查学位分布的好主意-我得看看!
兰迪·奥尔森
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.