数据挖掘论文/示例

机器算法验证 r 数据挖掘
2022-03-26 15:33:39

我正在寻找一些关于数据挖掘的中长篇论文/网站/等,特别是从数据准备到最终模型深入探索一个数据集的地方。我对有关机器学习算法的应用以及基本数据建模的讨论特别感兴趣。一个例子是 Luis Torgo 的书 'Data Mining with R'。任何建议,将不胜感激。

4个回答

查看Kaggle.com 博客,获奖者在此讨论他们解决数据挖掘竞赛的方法。然后,您可以返回 kaggle.com 网站获取描述和数据并自己尝试。

这是一个很好的起点:

数据挖掘中的 10 大算法

在那里的数据准备方面不多,但在应用程序方面却很多。还有很多很好的相关论文链接可供阅读。

我向您推荐来自免费的统计软件杂志的文章。

您可以在那里找到数据挖掘/机器学习的不同应用以及对真实数据示例的分析。大多数文章都是关于 R 包的,因此您也可以同时在 R 中执行他们的分析。期刊中的文章还包括 R 代码,R 中的包包括数据。

所有数据都在那里进行了深入分析,因此对我来说这是非常有价值的来源。

caret R 包有一组四个小插曲,它们从一些原始示例数据集开始应用各种数据准备任务、监督学习算法、特征选择和数据可视化。

尽管重点是如何使用 caret 本身提供的功能来做这些事情,但它仍然普遍适用并且对于现实世界的项目来说非常好阅读。

以下是四个 PDF 插图的直接链接: