Python中有好的“频繁序列挖掘”包?

数据挖掘 Python 顺序模式挖掘
2021-10-05 00:09:36

除了 MLLib 中的 FPM 之外,有没有人在 Python 中使用(并且喜欢)任何好的“频繁序列挖掘”包?我正在寻找一个稳定的包,最好由人们维护。谢谢!

4个回答

我正在积极维护 Python 3 中 PrefixSpan 和 BIDE 的有效实现,支持挖掘频繁和 top-k(封闭)顺序模式。

我发现的唯一 Python 包在Github上。

他们在那里有一个实现BIDE,但它不是维护的代码。

你想过自己写它吗?因为现在可能没有最新的维护库。

看看这个,它是基本的——PrefixSpan 和 Closed/Maximal 模式实际上并不难实现。

我过去使用过fim的 fpgrowth 功能,效果很好。然而,在 Windows 机器上安装有点痛苦。它似乎是一个学术网站,所以我不确定他们是否随着时间的推移对代码进行了许多更新......