我碰到了一篇使用链接异常检测来预测趋势主题的论文,并且发现它非常有趣:该论文是“通过链接异常检测在社交流中发现新兴主题”。
我想将其复制到不同的数据集上,但是我对如何使用它们的方法并不熟悉。假设我有六个月的一系列节点网络快照。节点具有长尾度分布,大多数节点只有几个连接,而有些则有很多。新节点将在此时间段内出现。
我如何实现本文中使用的顺序折算归一化的最大似然计算来检测我认为可能是爆发的先兆的异常链接?还有其他更合适的方法吗?
我在理论上和实践上都在问。如果有人可以指出我用python或R实现该方法的方法,那将非常有帮助。
任何人?我知道你们那里的聪明人有一些开始思考的答案,
1
如果您不介意放松R / python偏好设置,我的这项工作可能会有所帮助吗? goo.gl/l7SLlB 此方法的一些优点是您无需担心功能类型,规范化等问题。
—
arielf 2014年
除非我误解了这个问题,否则您应该能够按照本文的作者实现该方法的相同方式来实现该方法。如果该方法无法从论文中重现,则应联系作者。作者可能还愿意提供他们的代码。如果您有特定的理论问题或编程问题,则应分别提出。
—
纳特