我有一种情况,我需要提出一个解决方案以及需要用于以下业务案例的技术堆栈
商业案例:我收到来自不同汽车制造公司的汽车制造数据集,每种汽车型号的数据集不同,属性数量也不同,但我确实每 2 分钟在 csv 文件中收到它们。我需要选择一种特定的存储格式,以便每个车型都可以轻松查询,并且根据车型,我选择,我应该能够显示该车型的不同特征。对于这种类型的数据分析,是否有推荐的架构?
我有一种情况,我需要提出一个解决方案以及需要用于以下业务案例的技术堆栈
商业案例:我收到来自不同汽车制造公司的汽车制造数据集,每种汽车型号的数据集不同,属性数量也不同,但我确实每 2 分钟在 csv 文件中收到它们。我需要选择一种特定的存储格式,以便每个车型都可以轻松查询,并且根据车型,我选择,我应该能够显示该车型的不同特征。对于这种类型的数据分析,是否有推荐的架构?
鉴于您收到的数据模型不同,您最好使用像 mongodb 这样的 NoSql 存储。
这是我将使用的技术堆栈(python):
如果需要,我将非常乐意详细说明。
AWS 云解决方案步骤-