地理定位数据的 NoSQL 引擎/服务推荐

数据挖掘 大数据 聚类
2021-10-04 17:58:42

首先,我是大数据这个领域的新手,所以我的问题可能很幼稚。

为了构建一个处理地理定位数据的应用程序,这些数据可以是:纬度和经度坐标以及地理 SQL Server列类型。

我需要使以下元素变得容易:

  • 可扩展性:准备好接收大量数据,向系统添加服务器必须很容易
  • 接近请求:例如,一个圆圈中有多少点(以米为单位)。
  • 数据在写入后必须能够快速访问。

我一直在寻找现有的解决方案,它们是“Hadoop 友好的”(Hortonworks、Cloudera)和可用的 DBMS,比如 Cassandra。我找到了一些有趣的信息,但我仍然认为很难决定,该选择哪一个。它还需要NodeJS.NET的驱动程序(带有 Cassandra 的 Hadoop 似乎可以接受)。我也环顾了 MongoDB 生态系统,但是,我再次觉得很难知道从哪里看。根据Mongoose的(很少)经验,MongoDB可能会因为数据写入速度慢而被第三点取消资格。但我的模型当然可以改进。

你们中的任何人最近都有处理大量地理位置数据的经验吗?我希望在这里分享它们以及有关该主题的任何质量和最新文献。

1个回答

一种方法是使用在分布式存储(如 Cassandra 或 Hbase)之上运行的非 SQL 数据库。添加支持空间索引(例如弹性)的外部索引以进行快速搜索。这使您的解决方案可扩展(由于分布式存储)并且对于空间搜索查询来说足够快。