我的 Web 应用程序存储使用数据,例如:
- 门票 开启 关闭
- 执行的任务
- 用户评分
等等。我需要显示使用和性能趋势的仪表板和报告,例如:
- 一个时期内开/关了多少张票?
- 平均任务执行时间是多少?
- 谁是最活跃的用户?
- 哪个用户得分最高?
等问题是开放的,我们可以发明更多。
这种情况是否属于数据仓库经典方法?数据来自具有特定数据模型的关系数据库。
有人要我创建一个数据湖,只给他我所有的原始数据。我不明白数据湖如何适合这张照片。没有模型和关系,我的数据毫无用处。
此外,我没有事件流:我在关系数据库中有表。例如,“任务”表中的一行将有一个“打开时间”列和一个“关闭时间”列。
我对创建数据湖与传统数据仓库方法的需求或优势感到困惑