我偶然发现了这篇论文,它使用链接异常检测来预测热门话题,我发现它非常有趣:这篇论文是“通过链接异常检测发现社交流中的新兴话题”。
我很想在不同的数据集上复制它,但我对知道如何使用它们的方法不够熟悉。假设我有一系列为期六个月的节点网络快照。节点具有长尾度分布,大多数只有少数连接,但有些连接很多。在此时间段内出现新节点。
我如何实现论文中使用的顺序折扣归一化最大似然计算来检测我认为可能是爆发前兆的异常链接?还有其他更合适的方法吗?
我在理论上和实践上都问。如果有人能指出我在 python 或 R 中实现这一点的方法,那将非常有帮助。
任何人?我知道你们那里的聪明人有一些开始的想法来回答,