时间序列的变化

机器算法验证 时间序列
2022-03-15 14:05:53

我正在尝试做一些非常简单的时间序列工作。我开始查看每月统计数据,但我想得越多(而且我阅读 IrishStat 的帖子越多),我就越意识到我对此的看法存在根本性的缺陷。我认为这是的主要原因是使用每月汇总数据存在过多的时间问题:

  • 不同的月份长度
  • 不同数量的工作日
  • 周末
  • 节假日

但让我明白的是,这一定是一个非常普遍的问题,我的意思是几乎每家大公司都必须有一份包含月度数据的执行报告。如何平衡您比较的月份之间的差异?

我正在使用 R 慢慢地爬过这些东西,目前我只是在查看与滞后的互相关。我已经研究了分解以及如何根据季节性进行调整,但是如何根据您知道会对业务活动产生影响的日期进行调整?有没有办法整合一个应该区别对待的日期列表,或者以某种方式补偿一个月(或一周或一年)中的周末/节假日天数?

对此概念的一般解释将不胜感激。

编辑以使问题更简洁:

我正在查看每月计数的时间序列。该时间序列的 2 个示例是:

  • 2012 年 2 月为 29 天,有 8 个周末和零个公共假期
  • 2013 年 5 月是 31 天,还有 8 个周末,还有 2 个公共假期

我如何比较它们而不使我的结论受到它们的差异的不利影响?

  • 我可以按月除以天数,但这不考虑假期
  • 我可以按一个月的工作日来划分,但这并不能区分假期和周末。
2个回答

您要求对该概念进行一般性解释。您对三个聚合级别的当前预测状态的评论已失效!我的回答可能无法准确处理您的某些特定兴趣,因为您专注于一些分心的事情,但我认为我会与您分享以下内容。我被要求讨论我帮助编写的软件如何处理和适应每月、每周和每日的预测。

我的回答分为三个部分: A. 对每周与每月的总体评论 B. 将每月预测解析为每日的论点;使用简单的比率 C. 反对 #2 的论点以及将每日预测直接开发然后用于进行每周和/或每月的预测。

回应 A)

每月:

优势 – 计算速度快、建模更容易、更容易识别趋势变化、更适合战略性长期预测

缺点——如果您需要计划每日的产能、人员和产品损坏水平,那么更高水平的预测将无助于了解每日需求,因为 1/30 的日粮估计显然是不够的。

频繁变化的因果变量(即每天/每周 - 价格、促销)不容易整合到月度分析中

整合季度失业等宏观经济变量需要创建样条曲线的额外步骤。

每周:

优势 – 当您无法处理日常建模过程时,您可以“解决”这个问题。当您有非常系统的周期性循环时,例如遵循刚性曲线且不需要一周中的某天变化的“北极冰层范围”。

缺点 – 像感恩节、复活节、斋月、农历新年这样的浮动假期每年都会发生变化,并且会扰乱对一年中一周影响的系数的估计,可以通过为每个假期创建一个变量来处理这些影响。

由于每年没有 52 周,一年中的周数可能会发生变化并产生统计问题。我们已经看到需要将第 53 周分配给“非玩家”周,以使数据成为标准的 52 周周期,这是可行的,但与日常数据相比具有破坏性。

频繁变化的因果变量(即每天/每周 - 价格、促销)不容易整合到月度分析中

整合季度失业等宏观经济变量需要创建样条曲线的额外步骤。

回应B)(半开玩笑的回答)

假设您在数据仓库中拥有每日数据,并且您希望根据每月预测进行每日开发。

我会按以下方式进行每月预测并将其划分为每日。

  1. 从历史数据库计算每日平均值,因此 D1,D2,….D7 平均值是已知的,将被使用我将计算总体平均值 (XBAR) 并计算 7 个指数 I1=D1/XBAR ;I2=D2/XBAR .... I7=D7/XBAR 因此 7 I 代表百分比,即

.9,1,2,…..8 例如。

  1. 然后,我将使用适当的 I 值计算当月 DAY1 的预测,并得到 [1/30]*Monthly forecast*I ,基本上将基线每日预测调整为每月预期的 1/30。

  2. 最后,我会将这些每日预测标准化,以便它们添加到每月预测中。

回应 C)

我还应该补充一点,我在 (B) 中列出的程序受制于一些关于历史数据的假设,我认为其中大部分是不切实际的:

1) 没有趋势,也没有水平变化。2) 没有 PULSES(一次异常值) 3) 没有假日效应或月中的特殊日子效应或月中的特殊周效应或月初/月末效应 4) 没有季节性影响(每月或每周) 5) 随着时间的推移,每周平均数没有变化 6) 没有自回归结构
7) 模型参数或误差随时间变化没有变化。

所有这些考虑都表明,应该在日常层面开发模型,以便尽快提供信息。

希望这可以帮助 !

这将取决于您的研究问题。

我很感兴趣,到目前为止这个问题还没有答案;这是否意味着没有标准解决方案?季节性调整似乎是非常临时的......

如果您正在查看的公司专注于“工作日”(例如,他们是一家只在那些日子生产的公司),那么每个工作日的计数是有意义的。但是,如果即使在节假日和周末也有业务,那么每天只进行计数可能会更好。无论哪种情况,您都可能会发现,在任何建模中,您都希望将周末和/或非工作日的数量作为变量包括在内,以查看它是否有助于解释。