Facebook终结了吗?


138

最近,本文受到了很多关注(例如,《华尔街日报》的关注)。基本上,作者得出的结论是,到2017年,Facebook将失去80%的成员。

他们的主张基于SIR模型的外推,SIR模型是流行病学中经常使用的隔间模型。他们的数据来自Google搜索“ Facebook”的内容,作者使用Myspace的灭亡来验证他们的结论。

题:

作者是否犯了“相关并不意味着因果关系”的错误?该模型和逻辑可能适用于Myspace,但是对任何社交网络都有效吗?

更新Facebook回击

与科学原则“相关等于因果关系”相一致,我们的研究明确表明普林斯顿可能有完全消失的危险。

我们真的不认为普林斯顿大学或世界的空气供应很快就会消失。我们热爱普林斯顿大学(和空气),并最后提醒我们:“并非所有研究都是平等的,而且某些分析方法会得出非常疯狂的结论。


26
好吧,根据本文,Facebook搜索的数量可能会激增。;)
RobertF 2014年


15
@Glen Develin先生似乎已经完全错过了研究的重点。首先,它不仅是预测搜索趋势,而且还使用它们来验证和校准来自著名SIR系列的模型,这被认为是流行和被流行的很好的描述。第二,他的“聪明”反例失败了,因为与Facebook不同,普林斯顿大学和空中学院都不主要在网上使用。他赞美了相关原因的赞美,但是相关是通过MySpace到Facebook,而不是基于Facebook的历史数据。此外,存在利益冲突。
最佳

6
分析是嘲弄的。正如两个答案所描述的那样,外推点似乎没有任何变化是有效的。
2014年

5
这不能回答问题,而只是一堆个人意见,完全与统计无关。
ziggystar 2014年

Answers:


165

到目前为止,答案都集中在数据本身上,这对于当前所在的站点及其缺陷是有道理的。

但是从倾斜角度来说,我是一位计算/数学流行病学家,所以我还将讨论模型本身,因为它也与讨论有关。

在我看来,本文最大的问题不是 Google数据。流行病学中的数学模型一直在处理混乱的数据,在我看来,可以通过相当简单的敏感性分析来解决其问题。

对我来说,最大的问题是研究人员已经“走向成功”了,这在研究中应该始终避免。他们在他们决定适合数据的模型中执行此操作:标准SIR模型。

简而言之,SIR模型(代表易感性(S)传染性(I)恢复的(R))是一系列微分方程,用于跟踪人口经历传染病时的健康状况。感染者与易感者互动并感染他们,然后及时转移到恢复的类别。

这将产生如下所示的曲线:

在此处输入图片说明

美丽,不是吗?是的,这是僵尸流行病。很长的故事。

在这种情况下,红线就是被建模为“ Facebook用户”的东西。问题是这样的:

在基本的SIR模型中,I类最终将不可避免地渐近地接近零

它必须发生。建模僵尸,麻疹,Facebook或Stack Exchange等都没有关系。如果使用SIR模型进行建模,则不可避免的结论是,传染性(I)类的数量下降到大约零。

SIR模型有非常直接的扩展,使之不成立-要么您可以让处于恢复(R)类别的人回到易感(S)(本质上,这就是那些离开Facebook的人从“我是永不回头”到“我有一天可能会回头”),或者您可以让新的人加入到人口中(这是蒂米和克莱尔(Timmy and Claire)买的第一台计算机)。

不幸的是,作者并不适合那些模型。附带地,这是数学建模中普遍存在的问题。统计模型是试图描述变量模式及其在数据中的相互作用的尝试。数学模型是对现实断言。您可以得到一个SIR模型来适应很多情况,但是您对SIR模型的选择也取决于系统。即,一旦达到峰值,就趋向于零。

顺便说一句,互联网公司确实使用了用户保留模型,这些模型看起来很像流行病模型,但它们也比本文中介绍的模型更为复杂。


4
是的,我也想念其他模特。我不了解流行病学模型,但是我知道营销中使用的S曲线模型。一篇评论文章(Meade,伊斯兰教,技术预测-模型选择,模型稳定性和组合模型,管理科学,1998年,第44卷,第8期)列出了30种不同的模型。这些模型中的大多数具有相似的推理,而不是易感性,传染性和恢复性,它们使用术语“早期采用者”和“模仿者”(或类似者)。然后,该模型是某些微分方程的解。
mpiktas 2014年

1
您几乎不需要证明在交叉验证(CV)上谈论统计模型是正确的...您是否建议不谈论该模型是CV本身的缺陷?无论哪种方式,如果您真的想提高意识或进行建设性的评论,澄清都会有所帮助。或者,如果切线不值得澄清,那么到底有什么值得一提的呢?至于Facebook用户是僵尸的(无意间?)建议……我没有异议。(即使我是一个!:)
Nick Stauner 2014年

4
僵尸真棒!...,直到他们咬你:P
Joe DF 2014年

13
(+1)这是我对他们的文章的主要抱怨。他们假设一个模型必须预测崩溃,然后通过挑选一个表现出他们所预测的行为的单一站点(MySpace)来验证该模型。对于这种模型,有意义的代表是可比较站点的数量,他们在一个站点上对其进行了测试。
2014年

11
@NickStauner不,这只是一个观察,表明这里的大多数批评(以及实际上,在其他互联网上)都是关于数据本身的。这是有道理的,因为数据本身是大多数用户在此处可以轻易批评的东西,而模型的实际细节并不是我所期望的“平均统计学家/机器学习专家”。
Fomite 2014年

111

我对本文的主要关注是,它主要关注Google搜索结果。众所周知的事实是,智能手机的使用正在增加(Pew InternetBrandwatch),而传统计算机的销售却在下降(可能是由于旧计算机仍在运行)(SlateExtremeTech),因为越来越多的人使用智能手机访问互联网。考虑到至少有一个适用于iOS,Android,Blackberry和Windows Phone的本地Facebook应用程序,因此Google对“ facebook”的查询数量大幅下降也就不足为奇了。如果用户不再需要打开浏览器并在URL栏中输入“ facebook.com”,那肯定会对搜索数量产生负面影响。实际上,使用该应用程序的FB用户数量已大幅增加(TechCrunchForbes)。

我认为这项研究只是一些“呵护,有趣的相关性”,而这一点已被危言耸听的媒体所忽视。“您知道世界在变化吗?这真是出乎意料!”


3
放得好,就像您说的那样,智能手机的使用正在增加,facebook每月从手机/智能手机获得的访问量非常大。仅仅因为人们没有搜索它并不意味着它会导致Facebook使用率下降,所以人们使用Facebook的方式正在改变/改变。他们不再搜索它,他们只是单击手机上的图标并转到它。
MCP_infiltrator 2014年

2
我正要就智能手机和Google搜索回答同样的问题
syed mohsin 2014年

“考虑到(至少)适用于iOS,Android,Blackberry和Windows Phone的本地Facebook应用程序,对于“ facebook”的Google查询数量已大大下降也就不足为奇了……搜索也在智能手机上进行,并且在每个浏览器上都会实现一个称为书签的东西。
杰弗里·布拉特曼

@JeffreyBlattman“在每个浏览器中都有一个叫做书签的东西” .. Opera 15+除外。:)
landroni 2014年

2
@Adrian书签是浏览器的最基本功能,自网络打开之日起,它就存在于每个浏览器中。
Jeffrey Blattman 2014年

61

好吧,本文建立了这样一个事实,即Google在Facebook上的搜索数量恰好符合特定曲线。因此,充其量它可以预测,Facebook上的搜索量将下降80%。这可能是可行的,因为Facebook可能变得无处不在,没有人需要搜索它。

这种类型的模型的问题在于,它们假设没有其他因素可以影响所观察变量的动态。在处理与人相关的数据时,很难证明这一假设是正确的。例如,该模型假设Facebook无法采取任何措施来弥补其用户流失,这是一个非常可疑的假设。


3
mpiktas的第一段也提到了一个好点-作者使用Google搜索查询作为Facebook帐户数量的代理。为什么不直接查看帐户数据?不难发现:news.yahoo.com/number-active-users-facebook-over-230449748.html
RobertF 2014年

尽管公平地说,对以上文章中的数据进行图形显示确实显示了活跃用户数量在2013
。– RobertF 2014年

4
除了患者之间的感染动态以外,其他因素也会影响疾病的传播(例如公共卫生计划)。这不会阻止基础模型的使用。我认为,Facebook去世的确切日期(毫无疑问会受到影响)并不像社交网络像疾病一样传播的想法/模型那样有趣。
david25272 2014年

3
@ david25272这种模型肯定有用,在市场营销中,有很多有关S曲线的文献都使用类似的方法。例如,我怀疑Bass模型及其对应模型也可能很好地适合相同的数据。
mpiktas 2014年

15

我认为Google趋势无法为这种研究案例提供良好的数据集。Google趋势显示了使用Google搜索一个词的频率,因此至少有两个原因引起对该预设的怀疑:

  • 我们不知道用户是否在Google Facebook上搜索以登录或他是否在搜索有关Facebook的信息

Facebook不仅是一个网站的现象,而且还有很多关于该网站的文章,书籍和电影。FacebookInc.在2012年5月18日开始向公众出售股票并在纳斯达克交易。Google趋势向您同时显示:网站搜索和“现象”搜索。新事物总是对大众产生重大影响,电视对大众产生了巨大影响,现在没有人撰写有关它的文章,但它仍然是使用最广泛的设备之一。

  • 大多数用户不会在Google上搜索“ facebook”来登录

使用移动应用程序和书签,只有第一次在Google上具有互联网搜索“ facebook”知识的用户才能将其另存为书签或下载该应用程序。下图是Wikipedia的Google趋势,看来将来我们不会使用Wikipedia。显然,这是不正确的,我们根本无法访问键入“ wikipedia”的Wikipedia,而只是搜索然后使用Wikipedia页面,或者使用书签来访问它。

在此处输入图片说明


4
不要忘记地址栏中有关浏览器历史记录的自动完成功能。我在Chrome或Firefox中输入字母“ f”,它会自动完成对facebook.com的提示。此功能已启用多年。
保罗

4
Most users don't search "facebook" on Google to login...我打赌50英镑,这确实是大多数搜索的目的。
Evgeni Sergeev 2014年

2
@EvgeniSergeev我也打赌你!您的假设与我的陈述并不矛盾,我认为这是进行这些搜索的原因,但实际上并非访问Facebook的最常用方法(这对研究而言很重要)一个简单的事实是,去年Facebook移动用户超过桌面用户
通用汽车

13

本文突出了一些基本问题:

  • 假设搜索引擎查询有关社交网络不断增长与成员数量增加的相关性。过去可能与此相关,但将来可能不相关。

  • 很少有新的大型社交网络。您几乎可以单指望他们。Friendster,Myspace,Facebook,Google +。此外,Stack Exchange,Tumblr和Twitter的功能类似于社交网络。有人预测Twitter结束了吗?恰恰相反,它似乎具有主要动力。没有太多提及或研究其他内容是否合适。用我们正在谈论的方式,在5-7个数据点之间是否存在趋势?(社交网络的数量。)数据太少,无法对未来做出任何结论。

  • Facebook取代了Myspace。那是主要动力。它没有考虑到一种感染正在取代另一种感染的想法,而是倾向于将它们分开考虑。什么在取代Facebook?Google+?推特?客户从一种“品牌”或“产品”到另一种的相互作用和“背叛”是这一领域的关键现象。

  • 社交网络共存。一个可以是多个站点的成员。的确,成员可能会倾向于彼此优先。

  • 似乎有一个更好的模型,那就是正在进行整合,例如在经济学中,例如与汽车,无线电制造商,网站等的整合。就像在任何新的颠覆性技术中一样,一开始就有很多竞争对手,然后后来,领域缩小了,它们趋于合并,出现了收购和兼并,有些在竞争中消亡了。我们已经看到了这样的例子,例如,雅虎最近收购了Tumblr。

  • 类似的概念可能是电视网络合并并由大型集团拥有,例如大型媒体公司拥有许多媒体资产。实际上,Myspace已被新闻集团收购。

  • 要走的路是在经济学和感染(生物学)之间寻找更多的类比。从竞争者那里获得客户并吸收产品的公司确实确实在流行病学上有许多相似之处。有很强的相似之处进化“红皇后”的比赛[看看书,红皇后由雷德利。可能与所谓的生物经济学领域有联系。

  • 另一个基本模型是产品相互竞争,并具有各种“进入壁垒”,以使客户从一个品牌转换到另一个品牌。的确,网络空间的交换成本非常低。这类似于竞争客户的啤酒品牌等。

  • 在渐近模型中,网络更有可能将其成员增加到某个渐近最大值,然后趋于平稳。在高原的早期,它显然不是高原。

综上所述,我认为它具有一些非常有效且引人入胜的想法,并有可能推动进一步的研究。它是开创性的,开创性的,只需要对其声明进行一些调整。我对使用Stack Exchange和分析本文的协作智慧/集体智慧感到高​​兴。(现在,如果只有研究主题的记者会在准备简单的声音片段之前仔细阅读整页)。


2
顺便说一下术语。“进入壁垒”是指想要发布新产品并在新领域竞争的公司,类似的概念也适用于“转换交易的另一面”的客户转换产品,但是那里可能有不同的术语吗?无论如何,作者需要将他们的想法与市场营销结合起来,而市场营销的确使用了更多的“病毒式”模型。[应该在上面提到过]这方面的一个关键概念就是市场份额
vzn 2014年

1
ps可能是一个更相关的问题,这一领域的其他最新研究也支持该问题:facebook的 增长 即将终结。例如,青少年人口使用率下降了(这很值得注意,因为最初的增长是由于青少年造成的)。最近的一些研究/专家证实了这一点。因此,了解人口群体的转变也是了解社交网络使用趋势的关键。同样,facebook在美国“饱和”之后正在尝试向国际扩张,那里的障碍是互联网数量减少,手机/计算机等减少……
vzn 2014年

6

问题不是“如果”,而是“何时”。

已经结束。 http://www.ted.com/talks/geoffrey_west_the_surprising_math_of_cities_and_corporations.html

我不喜欢使用SIR模型。它带有假设。

假设之一是最终每个人都“恢复”。感染不是永久性的,而技术的采用可以是永久性的(例如考虑汽车)。

如果企业注定要最终死亡,那么当经历死亡之际,易感,感染和恢复之间的关系可能会通过特定的SIR模型进行适当建模。这并不意味着该模型可以描述寿命终止前的任何季节。它没有考虑其他因素-环境。Facebook是“ Myspace”结尾上下文的一部分,因此,尽管SIR仅适合Myspace的使用,但它不适合社交网络使用,因为许多用户在这两个帐户上都有帐户,并切换为FB为主的用法。

我研究了僵尸模型,甚至通过一些非僵尸SIR拟合,在那里更适合使用时间和人口打点窗口。它不是通用模型,它具有优点和缺点。这意味着,即使对于设计用于建模的系统,SIR也不完美。这种针对目标的根本缺陷表明,如果不谨慎使用,目标区域之外的应用可能比其他模型更具问题。


2

回答你的问题

该模型和逻辑可能已经适用于MySpace,但是对任何社交网络都有效吗?

可能不是。历史数据只能在“环境”相似的情况下预测未来事件。本文假设Google用户和查询的总数是一个常数,当然不是。现在,本文可能会讲更多有关Google而不是有关Facebook的信息。

但是,基于MySpace等其他许多社交网络的迅速兴衰,我认为可以肯定地认为,在5年内Facebook不再是主导社交网络的可能性很大。


预测并不完全取决于环境的相似性(当然,取决于您所说的“环境”的意思)。但是,您的回答似乎内部不一致。不能断定Facebook的未来将仅以此为基础类似于其他社交网络的课程,更不用说在这么短的时间内。
Nick Stauner 2014年

我对Facebook未来的预测是我使用一个论点的观点。我的意见显然不是基于统计数据或模型。本文讨论的预测是基于具有历史参考意义的统计数据和模型。我不明白为什么我的答案内部不一致。
尼布2014年

1
您的观点的一个支持论点听起来很像是您为该逻辑所批评的模型背后的逻辑。如果(代代?)环境现在与模型适合Myspace时的环境还不够相似,为什么它足够相似以使任何观点都基于Myspace的历史呢?此外,Facebook真的是另一个行为会彼此相同的社交网络吗?与时代一样,它在很多方面都足以令人怀疑,所以再次重申,我不认为在如此短的时间范围内承担类似命运的机会是多么安全。
Nick Stauner 2014年

1

如果我们看一下社交网络的地图,那么流行模型在某些情况下适用。

http://vincos.it/world-map-of-social-networks/

该文章可能还有其他一些示例(Friendster和Orkut是其用户大量拒绝的一个很好的示例),并且还考虑到人们通常会迁移到提供更好或新服务的其他社交网络这一事实。

Facebook改变了人们交流的方式。与Orkut相比,用户需要输入其他人的个人资料才能查看其更新。另一方面,在Facebook上,提要现在位于他自己的时间轴上。 这是一个重大变化。

该模型和逻辑可能已经适用于MySpace,但是对任何社交网络都有效吗?

恕我直言,人们不会离开社交网络。他们基于更好的服务,功能或体验进行迁移。

问题是:会有更好的社交网络吗?也许是Google +。


2
这个答案似乎没有解决这些问题,这些问题是:(1)关于因果关系可能引起混淆的统计问题;(2)是否可以期望将预测模型普遍应用。如果我误会了,也许是因为第一句话中“ this”的含义完全不清楚。
whuber

2
@whuber这个答案说只要人们仍然需要社交网络就没有关联。除非Facebook有更好的替代方案(问题中的论文未将其考虑在内),否则Facebook将是王者。从统计上讲,“社交网络”的需求只是在增长,人们只是从一个社交网络迁移到了另一个社交网络。到目前为止,社交网络的使用一直在增长。
Tiberiu-Ionuț Stan

2
@ Tiberiu-Ionuț Stan您的评论可能是正确的,但仅包含有关社交网络的不受支持的评论;它似乎没有任何统计上的推论,也没有为这个问题提供任何其他启示。特别是,我仍然看不到此相关性或因果关系的特定答案中的任何特定参考。请记住,我们不是在这里辩论Facebook的未来或社交网络的质量,而是要我们评估有关论文中的统计论点。
whuber

@whuber我正在尝试评估该论文的统计论据,以说明结果背后的原因。本文不考虑其他OSN和新兴趋势,仅考虑数字。我只是添加信息。IMO这与股票市场中的技术和基本面分析相同(都可以)。我试图解释变化背后的事实,不仅是数字和图表。
edubriguenti 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.