Questions tagged «social-network-analysis»

2
伦理学应如何应用于数据科学
最近有一种骚动,facebook在对其用户进行试验,以查看他们是否可以改变用户的情绪,现在变得很沮丧。 虽然我不是专业的数据科学家,但我从Cathy O'Neill的著作《 Doing Data Science》中读到了有关数据科学伦理学的信息,并且想知道这是否是在专业水平上教授的专业知识(我希望如此)或在专业领域被忽略或轻描淡写。特别是对于那些最终意外完成数据科学的人。 在链接的文章谈到数据完整性的同时,该书还讨论了理解所创建的数据模型的影响以及这些模型的影响背后的道德伦理,这些模型的使用不当(有时是无意间)或模型使用时可能产生不利影响。不准确的话,又会产生不利的结果。 本文讨论了行为准则,并提到了数据科学协会的行为准则,这是否正在使用中?规则7特别引起关注(从其网站上引用): (a)与数据科学家就某件事形成客户-数据科学家关系的可能性进行咨询的人是准客户。 (b)即使未达成客户与数据科学家的关系,从潜在客户那里学习到信息的数据科学家也不得使用或泄露该信息。 (c)受(b)款约束的数据科学家,如果其从利益相关者那里收到信息,则不得为其利益严重不利于相同或基本相关行业中的潜在客户的利益的客户提供专业的数据科学服务在那件事上可能对那个人有很大的伤害 这是专业实践吗?许多用户盲目接受我们获得了一些免费服务(邮件,社交网络,图像托管,博客平台等),并同意EULA以便向我们推送广告。 最终,这是如何受到监管的,我经常读到有关服务条款变更时用户会变得武装起来的消息,但似乎需要一些自由组织,集体诉讼或参议员对此类事情做出反应,然后事情才能发生。 顺便说一句,我在这里没有做出任何判断,也没有说所有数据科学家的行为都是这样,我对学术教学和专业实践感兴趣。

1
Neo4j vs OrientDB vs泰坦
我正在从事与社会关系挖掘有关的数据科学项目,需要将数据存储在某些图形数据库中。最初,我选择Neo4j作为数据库。但是它接缝了Neo4j的伸缩性不好。我发现的替代方法是Titan和oriebtDB。我走过了这这三个数据库的比较,但我想获得这些数据库的更多细节。所以有人可以帮助我选择最好的人吗?我主要想比较这些数据库的性能,可扩展性,可用的在线文档/教程,Python库支持,查询语言复杂性和图算法支持。还有其他好的数据库选项吗?

3
如何为社交网络的成长提供动画效果?
我正在寻找一个库/工具来可视化添加新节点/边缘后社交网络的变化。 现有解决方案之一是SoNIA:Social Network Image Animator。它使您可以制作像这样的电影。 SoNIA的文档说,它现在已经坏了,除此之外,我更喜欢基于JavaScript的解决方案。所以,我的问题是:您是否熟悉任何工具,或者是否可以指出一些使该任务尽可能简单的库? 发布此问题后,我将深入探讨sigma.js,因此请考虑涵盖此库。 通常,我的输入数据如下所示: time_elapsed; node1; node2 1; A; B 2; A; C 3; B; C 因此,这里我们有三个时间点(1、2、3),三个节点(A,B,C)和三个边,它们表示三个所考虑的节点之间的三元闭合。 而且,每个节点都有两个属性(年龄和性别),因此我希望能够更改节点的形状/颜色。 同样,在添加新节点之后,最好具有一些ForceAtlas2或类似的算法来调整图形的布局。

7
LinkedIn网络抓取
我最近发现了一个新的R包,用于连接到LinkedIn API。不幸的是,LinkedIn API似乎很受限制。例如,您只能获取有关公司的基本数据,而这与有关个人的数据是分离的。我想获取有关给定公司的所有员工的数据,您可以在网站上手动进行操作,但无法通过API进行操作。 如果import.io能够识别LinkedIn分页,则将是完美的选择(请参阅页面末尾)。 有谁知道适用于LinkedIn网站当前格式的任何Web抓取工具或技术,或者如何弯曲API进行更灵活的分析?最好是在R或基于Web的环境中,但当然可以接受其他方法。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.