我正在尝试使用 R(例如使用神经网络和推荐系统)对一些大数据集(例如 400k 行与 400 列)进行一些分析。但是,处理数据花费的时间太长(具有巨大的矩阵,例如 400k 行与 400k 列)。有哪些免费/便宜的方法可以提高 R 性能?
我接受包或网络服务建议(欢迎其他选项)。
我正在尝试使用 R(例如使用神经网络和推荐系统)对一些大数据集(例如 400k 行与 400 列)进行一些分析。但是,处理数据花费的时间太长(具有巨大的矩阵,例如 400k 行与 400k 列)。有哪些免费/便宜的方法可以提高 R 性能?
我接受包或网络服务建议(欢迎其他选项)。
尽管您的问题不是很具体,但我会尝试为您提供一些通用的解决方案。您可以在这里做几件事:
好读:
既然您提到您正在构建一个推荐系统,我相信您有一个正在处理的稀疏矩阵。从 Matrix 包中检查sparseMatrix 。这应该能够帮助您将大尺寸矩阵存储在内存中并训练您的模型。