数据挖掘 - 使用 R 运行庞大的数据集 - 吾爱随笔录

数据挖掘大数据 r 优化加工

2022-02-27 12:56:52

我正在尝试使用 R（例如使用神经网络和推荐系统）对一些大数据集（例如 400k 行与 400 列）进行一些分析。但是，处理数据花费的时间太长（具有巨大的矩阵，例如 400k 行与 400k 列）。有哪些免费/便宜的方法可以提高 R 性能？

我接受包或网络服务建议（欢迎其他选项）。

2个回答

尽管您的问题不是很具体，但我会尝试为您提供一些通用的解决方案。您可以在这里做几件事：

好读：

既然您提到您正在构建一个推荐系统，我相信您有一个正在处理的稀疏矩阵。从 Matrix 包中检查sparseMatrix 。这应该能够帮助您将大尺寸矩阵存储在内存中并训练您的模型。

其它你可能感兴趣的问题