如果连接数不能为负,那么连接数如何为高斯呢?


14

我正在分析社交网络(不是虚拟网络),并且观察到人与人之间的联系。如果一个人会选择另一个人随机连接,则一组人中的连接数将以正态分布-至少根据我当前正在阅读的书。

我们怎么知道分布是高斯分布(正态分布)?有其它分布例如泊松,大米,瑞利等在理论高斯分布的问题是,该值从去+(虽然概率朝向零去)和连接的数量不能为负。

没有人知道在每个人独立(随机)地搭接另一个人的情况下可以预期的分布吗?


1
澄清:是关于“整个组的连接总数”还是“一个人的连接总数”的问题?我的回答暗含了后者。

1
莱利分布?那是我的新事物。您有参考或链接吗?
一站式

3
也许是“瑞利”?
Whuber

Answers:


6

当有人和由人进行的连接的数量1 Ñ X ,然后连接的总数目为小号Ñ = Σ Ñ = 1 X / 2。现在,如果我们将X i设为随机变量,并假设它们是独立的,并且随着越来越多的人添加到混合中,它们的方差不是“太不相等”,则适用Lindeberg-Levy中心极限定理。它断言累积分布函数ni,1in,XiSn=i=1nXi/2Xi标准化总和收敛于正态分布的累积分布函数。这大致意味着随着增大,总和的直方图将越来越像高斯曲线(“钟形曲线”)。n

让我们回顾一下这没有说什么:

  • 它没有断言的分布是完全正态的。由于您指出的原因,它不可能。Sn

  • 这并不意味着预期的连接数量会收敛。实际上,它必须发散(到达无穷大)。标准化是对发行版的重新调整和调整。重新缩放的数量正在无限增长。

  • 不是独立的或当n增长时方差变化太大时,它什么也没说。(但是,“稍微”相关的一系列变量具有CLT的概括。)Xin


请注意,我并不是将问题解释为每个人都恰好选择另一个要连接的人,这将导致一个不育的理论,因为连接的数量是确定的,而不是随机的。相反,我将其解释为指出,每个进入网络的人都会随机选择n个连接,最终连接总数从0到n。当任何新手将建立的连接数量受到限制并且该数量具有一定的“最小”随机性时,就可以保证对方差的假设。
Whuber

Xi

1
@Andy不是人:建立连接的数量。重要的是,个人建立联系的可能性应该很大,并且不会固定下来。发生这种情况时,(连接数的)限制分布由确实变化的有限初始连接数确定,因此不可能渐近地逼近正态分布。
Whuber

1

答案取决于您愿意做出的假设。社交网络会随着时间不断发展,因此不是一个静态实体。因此,您需要对网络随时间的演变做出一些假设。

n

Prob(No of connections for any individual=n1)=1

如果一个人随机选择另一个人进行连接,那么最终每个人都会被连接。

但是,现实生活中的网络不会以这种方式运行。人们在几个方面有所不同。

  1. 任何人在任何时候都具有固定的网络大小,并且建立另一个连接的可能性是其网络大小的函数(随着人们介绍其他人等)。

  2. 一个人有自己形成联系的内在倾向(因为有些人是内向/外向等)。

这些概率会随时间,上下文等发生变化。除非我们对网络的结构做出一些假设(例如,网络的密度,人们的行为方式等),否则我不确定会有一个直接的答案。


@Srikant您能解释一下如何得出“平凡的答案”吗?(背后必须有一些未阐明的假设。)当您得出结论“最终每个人都将被连接”时,您指的是什么定理?这一点都不明显!
ub

@whuber我假设网络大小是固定的。问题指出:一个人随机选择另一个人进行联系,大概这是一个持续的过程。因此,随着时间的流逝,每个人都应该连接起来。没有定理,只有直觉。也许,我使用的语言不准确。

@Srikant我仍然感到困惑,因为经过很长一段时间,当n = 3时“ Prob(连接数= n)”等于1,否则始终为零。毕竟,当“每个人都应该连接”时,连接数等于n(n-1)/ 2。我怀疑您可能同时想到几个不同的随机过程。这可能有助于揭示您所做的假设,并且要更精确一些。
Whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.