(注意:从Area51 中的问题列表中提取了这个问题,但相信这个问题是不言自明的。也就是说,相信我明白了这个问题的一般意图,因此可能能够就这个问题提出任何可能的问题弹出。)
哪种大数据技术栈最适合处理推文、提取/扩展 URL 以及(仅)将新链接推送到 3rd 方系统?
(注意:从Area51 中的问题列表中提取了这个问题,但相信这个问题是不言自明的。也就是说,相信我明白了这个问题的一般意图,因此可能能够就这个问题提出任何可能的问题弹出。)
哪种大数据技术栈最适合处理推文、提取/扩展 URL 以及(仅)将新链接推送到 3rd 方系统?
我建议将Apache Kafka作为消息存储和您选择的任何流处理解决方案,例如Apache Camel或Twitter Storm