我试图了解所有“大数据”组件如何在现实世界的用例中一起发挥作用,例如 hadoop、monogodb/nosql、storm、kafka,......我知道这是用于不同的类型,但我想更多地了解他们在应用程序中的交互,例如为应用程序、webapp、在线商店思考机器学习。
我有访问者/会话、交易数据等并将其存储;但是如果我想即时提出建议,我不能在我拥有的一些大型日志数据库上运行缓慢的 map/reduce 作业。我在哪里可以了解有关基础架构方面的更多信息?我想我可以自己使用大多数工具,但是将它们相互插入似乎是一门艺术。
是否有任何公共示例/用例等可用?我知道各个管道在很大程度上取决于用例和用户,但只是示例可能对我非常有用。