关于如何成功测试 BIG ETL 或数据仓库应用程序,有人有什么建议可以分享吗?
我当然有自己的想法,但网上似乎只有一篇主要文章涵盖了基础知识:
数据完整性。确保加载所有预期数据。
数据转换。确保根据业务规则和/或设计规范正确转换所有数据。
数据质量。确保 ETL 应用程序正确拒绝、替换默认值、更正或忽略并报告无效数据。
性能和可扩展性。确保数据加载和查询在预期的时间范围内执行,并且技术架构是可扩展的。
集成测试。确保 ETL 流程与其他上游和下游流程一起正常运行。
用户验收测试。确保解决方案满足用户当前的期望并预测他们未来的期望。
回归测试。每次完成新的代码版本时,确保现有功能保持不变。