用于半结构化数据的 NoSQL 与 SQL 后端

数据挖掘 数据库 sql nosql
2022-02-21 20:52:32

我有一个职位描述语料库和另一个求职者简历语料库。我计划使用机器学习算法实施匹配系统,为每个职位描述找到前 5 名或前 10 名的申请人。我应该将数据存储在面向文档的 NoSQL db (MongoDB) 中还是坚持使用 SQL。

鉴于我拥有的数据充其量是半结构化的,我觉得 NoSQL 数据库将提供更大的灵活性。我将不胜感激对此的意见。

1个回答

我将使用 SQL 并创建一组在所有应用程序中通用的结构化字段(姓名、学校、工作年限、他们申请的工作等),其中一个字段包含您的“半结构化”部分的原始应用程序的数据。您总是可以对原始应用程序领域做一些花哨的事情,但是如果您想快速获得一些汇总统计数据,那么 SQL 是正确的途径。

一般来说,预先仔细考虑您的架构将在未来获得巨大的回报。只有当你真的不知道如何组织事物并且时间紧迫时,我才会推荐 NoSQL。即使获取集合中的键列表也需要MapReduce