数据挖掘软件工具的调查

机器算法验证 数据挖掘
2022-01-28 01:53:40

虽然我接受过工程师培训,但我发现我对数据挖掘越来越感兴趣。现在我正在尝试进一步调查该领域。特别是,我想了解存在的不同类别的软件工具,以及每个类别中哪些工具值得注意,以及为什么。(请注意,我并没有说“最好”的工具,只是说一些值得注意的工具,以免我们引发一场激烈的战争。)特别要注意开源和免费提供的工具——尽管不要认为这意味着我只对开源和免费感兴趣。

4个回答

这可能是您能找到的最全面的列表:mloss.org

看一下

  • Weka(java,分类强)
  • Orange(python脚本,主要是分类)
  • GNU R(R 语言,有点面向向量表,参见机器学习任务视图和Rattle UI)
  • ELKI(java,强大的聚类和异常检测,索引结构支持加速,算法列表
  • Mahout(Java,属于 Hadoop,如果你有集群和庞大的数据集)

以及用于数据集的UCI 机器学习存储库。

Rattle是一个数据挖掘 GUI,它为各种 R 包提供了前端。

看看KNIME

非常容易学习。有很大的进步空间。与 Weka 和 R 很好地集成。