用于测试数据产品的数据存储?

数据挖掘 nosql sql
2021-10-03 17:59:41

是否有推荐的方法来存储处理过的数据以测试新的数据产品?

基本上,我希望有一个系统,数据科学家或分析师可以考虑将新的数据产品呈现给用户,进行数据处理以创建它,然后将其放入我们的应用程序可以使用的数据存储中轻松访问。

我不确定什么样的数据存储对这种类型的“测试”用例有好处。因为它需要足够灵活来处理不同类型的数据产品,如聚合、窗口数据等。理想情况下,它不需要巨大的检测过程来尝试新事物。

1个回答

你可以试试 Azure 表存储。由于您无法将自己锁定到特定架构(因为一个数据产品可能是聚合,而另一个可能是时间序列或其他),Azure 表存储可以让您灵活地存储来自多个源的数据,每个源都有自己的格式。

这也有助于使系统具有高度可扩展性,因为您可以将 Azure 服务总线与 Azure 表存储结合使用。

您可以在 Pluralsight, Applied Windows Azure上查看本教程,因为它显示了许多示例,一个使用表存储和服务总线,另一个使用 Hadoop,我怀疑其中一些可能与您正在寻找的可扩展性相匹配。