Windows 中 R 的 GPU 加速数据处理

数据挖掘 r 显卡 平行线
2021-09-19 05:56:32

我目前正在撰写一篇关于大数据的论文,该论文让我们大量使用 R 进行数据分析。出于游戏原因,我碰巧在我的电脑中安装了 GTX1070。因此,我认为如果我能用它来加速我的讲师让我做的一些事情的一些处理,那将是非常酷的,但这样做似乎并不容易。我已经安装了 gpuR、CUDA、Rtools 和其他一些小东西,例如,我可以让它从基因组表达数据中创建 gpuMatrix 对象,但我还没有找到一个既适用于 gpuMatrix 对象的函数并且还提供任何明显的性能差异。也许这只是与 gpuR 包固有的限制有关——其他一些包似乎确实在谈论具有听起来更像我正在寻找的那种东西的功能,

几乎所有这些软件包都是专门用于 Linux 的,在 Windows 中实现对 R 的 GPU 支持是否特别困难?还是有其他原因导致在 Windows 中可用的软件包如此之少?从某种意义上说,我只是好奇,但真正让它发挥作用也很酷。令我惊讶的是,Windows 可用的东西如此之少,通常情况正好相反。

1个回答

根据我的经验,为 R 设置 GPU 处理很难,在 Windows 机器上设置它更难。此外,GPU 处理只能用于非常特定类型的计算。

如果您只是想为此设置GPU处理,那么我的回答是毫无用处的。

但是,如果您关心系统和代码的一般性能优化,我建议您检查以下步骤:

  • 使用 Microsoft R Open 而不是 Base R,因为它会自动在您的计算机上启用多核处理。

  • 矢量化您的代码

  • 使用诸如 data.table 之类的库而不是数据框

  • 避免生长物体

通常,R 的性能很大程度上取决于您的代码质量。Patrick Burns在R Inferno中提供了关于您可以做什么和应该做什么的非常好的总结。