首先,我是大数据这个领域的新手,所以我的问题可能很幼稚。
为了构建一个处理地理定位数据的应用程序,这些数据可以是:纬度和经度坐标以及地理 SQL Server列类型。
我需要使以下元素变得容易:
- 可扩展性:准备好接收大量数据,向系统添加服务器必须很容易
- 接近请求:例如,一个圆圈中有多少点(以米为单位)。
- 数据在写入后必须能够快速访问。
我一直在寻找现有的解决方案,它们是“Hadoop 友好的”(Hortonworks、Cloudera)和可用的 DBMS,比如 Cassandra。我找到了一些有趣的信息,但我仍然认为很难决定,该选择哪一个。它还需要NodeJS和.NET的驱动程序(带有 Cassandra 的 Hadoop 似乎可以接受)。我也环顾了 MongoDB 生态系统,但是,我再次觉得很难知道从哪里看。根据Mongoose的(很少)经验,MongoDB可能会因为数据写入速度慢而被第三点取消资格。但我的模型当然可以改进。
你们中的任何人最近都有处理大量地理位置数据的经验吗?我希望在这里分享它们以及有关该主题的任何质量和最新文献。