预测 Oracle 数据库中的分区何时归档

数据挖掘 预测建模 回归
2022-03-07 15:41:41

我们有一个 Oracle 数据库,其中主表“A1”按插入行的时间进行分区。插入的行可能会根据同一数据库中其他 6 个表(B、C、D、E、F、G)中的数据进行更新。

表 A1 中的分区通常会在开始接收数据后的几个小时内更新。分区更新完成后,分区被归档,即,它从生产转移到归档数据库。记录分区的创建时间和归档时间。

现在,我的问题是分区的过去创建历史和存档时间,我如何预测现在在 A1 中创建的分区何时存档?什么样的模型(回归等)最适合回答这个问题?如何建立一个模型来跟踪分区归档时间对其他表(B、C、D、E、F、G)中的属性的依赖性?

1个回答

我建议首先可视化您的数据。

归档分区的时间可以定义为分区开始(第一次可能的插入)和归档时间(最后可能的更新)之间的差异。

绘制该数据在某个时间间隔内的总分布 - 检查它是否遵循某种分布。平均值、中位数或标准差有意义吗?

每小时制作一个箱线图以查看四分位间距和异常值。

将其绘制为时间序列 - 它是否具有趋势或每日/每周模式?

在您的简单设置中(使用一个预测器和一个响应),这将使您对模型的预期准确性有印象。模型的选择取决于可视化的结果。

我个人会从最简单的模型开始:

  1. 之后归档的所有分区N小时;
  2. 每小时预测的独立模型说.9某个历史区间的分位数;
  3. 更高级 2.:考虑工作日和/或趋势和/或忽略异常值。

始终检查准确性并在达到预期时停止。