我试图理解解释 h2o 在数据科学计算方面如何比 R 和 SAS 更快的抽象细节。
H2O 比 R 或 SAS 快多少?
数据挖掘
机器学习
r
大数据
表现
sas
2021-09-29 22:40:21
1个回答
我用过 R、SAS Base 和 H2O。首先,我不认为 H2O 寻求成为 R 或 SAS。
H2O 提供高效的数据挖掘算法。您可以使用多个 API(例如他们的 R API)与 H2O 进行交互。将 R 和 H2O 结合起来的好处是,H2O 非常擅长以最少的用户努力利用多核或集群。仅在 R 中实现相同的效率要困难得多。
H2O 速度更快的原因是他们对数据有非常好的索引,并且他们的算法被编写成能够充分利用并行性。见http://h2o.ai/blog/2014/03/h2o-architecture/
带有默认矩阵动态库的 R 只能使用一个 CPU 内核。Revolution R 社区版随附英特尔数学核心函数库。这允许并行进行一些矩阵计算,但绝对不如 H2O 高效。对于 SAS 来说,考虑到它是封闭源代码,说起来有点困难,但根据我的 CPU 利用率,我假设他们有与 Revolution R 类似的方法。他们的矩阵代数利用了并行性,但他们的算法不如 H2O 高效。它们的数据存储也没有 H2O 高效。
最后,带有 R 的 H2O 的价格与 SAS 截然不同。
希望这能澄清一点。
其它你可能感兴趣的问题