通过 Twitter 对 Summingbird 的介绍和资料,提到在 Summingbird 中同时使用 Storm 和 Hadoop 集群的原因之一是通过 Storm 进行处理会导致级联错误。为了避免这种错误的级联和累积,Hadoop集群用于批量处理数据,并在Hadoop处理相同的数据后丢弃Storm结果。
产生这种错误累积的原因是什么?为什么它不在 Hadoop 中?由于我没有与 Storm 合作过,我不知道其中的原因。是因为 Storm 使用一些近似算法来处理数据以便实时处理它们吗?还是其他原因?