假设我有两个正在合并的不同公司的 2 个数据仓库。一些表是常见的,但包含不同的记录,而另一些则不同。如果我使用大数据环境,我可以将所有表作为数据沼泽放在一起,并使用以前数据仓库数据的存档创建新的数据湖,还是应该基于公用表构建一个新的数据仓库并添加不同的表?此外,是否有合并数据仓库的最佳实践步骤的良好来源?
合并 2 个数据仓库
数据挖掘
数据集
大数据
2022-02-10 18:45:04
1个回答
有一种可能适用的设计模式称为“扼杀者”。扼杀者设计模式将所有遗留系统留在原处,并逐个迁移到单个更新的系统。它通过创建一个代理接口来实现这一点,该接口将请求路由到旧系统或更新的系统。随着迁移的发生,代理将更多流量路由到更新的系统。
扼杀者设计模式的优点:
- 人们仍然可以使用遗留系统
- 根据有用性确定系统清理的优先级
- 可以创建明确的迁移路线图
其它你可能感兴趣的问题