我了解 Hadoop MapReduce 及其功能,但我对 R MapReduce 感到困惑。
我读过的一个区别是 R 使用了最大的 RAM。执行与 Hadoop 集成的 R 并行处理也是如此。
我的疑问是:
- R 可以做所有与统计、数学和数据科学相关的事情,但为什么要使用 R MapReduce?
- 通过使用 R MapReduce 而不是 Hadoop MapReduce,我可以完成任何新任务吗?如果是,请说明。
- 我们可以通过使用 R 和 Hadoop(直接)来完成任务,但是 MapReduce 在 R 中的重要性以及它与普通 MapReduce 有何不同?