具有许多零值的时间序列分析

机器算法验证 时间序列 相关性 克罗斯顿法 间歇时间序列
2022-01-23 07:57:17

这个问题实际上是关于火灾探测的,但它与一些放射性衰变探测问题非常相似。观察到的现象既是零星的,又是高度可变的;因此,时间序列将由被变量值打断的长零串组成。

目标不仅是捕获事件(零点中断),而且是事件本身的定量表征。然而,传感器是有限的,因此即使“现实”不为零,有时也会记录为零。因此,在比较传感器时必须包含零。

传感器 B 可能比传感器 A 更敏感,我希望能够以统计方式描述这一点。对于这个分析,我没有“真相”,但我有一个独立于传感器 A&B 的传感器 C。因此,我的期望是 A/B 和 C 之间更好的一致性表明与“真相”更好的一致性。(这可能看起来很不稳定,但你必须相信我——根据其他关于传感器的研究,我在这里的基础很稳固)。

那么,问题是如何量化“时间序列的更好一致性”。相关性是显而易见的选择,但会受到所有那些零(不能被忽略)的影响,当然还会受到最大值的不成比例的影响。也可以计算 RMSE,但会在接近零的情况下对传感器的行为进行强烈加权。

Q1:将对数缩放应用于非零值的最佳方法是什么,然后在时间序列分析中将其与零组合?

Q2:对于这种类型的时间序列分析,您可以推荐哪些“最佳实践”,其中非零值的行为是重点,但零值占主导地位并且不能被排除在外?

1个回答

重申您的问题“分析师如何处理长期没有遵循特定模式的无需求?”

您的问题的答案是间歇性需求分析或稀疏数据分析。当您相对于非零的数量有“很多零”时,通常会出现这种情况。问题是有两个随机变量;事件之间的时间和事件的预期大小。正如您所说,由于零序列错误地增强了acf,整套读数的自相关(acf)毫无意义。您可以追求像“克罗斯顿方法”这样的线程,它是基于模型的过程而不是基于数据的过程。克罗斯顿的方法容易受到异常值和需求率的变化/趋势/水平变化的影响,即需求除以数量自上次需求以来的时期。更严格的方法可能是追求“稀疏数据 - 不等间距数据”或类似的搜索。OSU 的 Ramesh Sharda 教授向我提出了一个相当巧妙的解决方案,我在咨询实践中已经使用了多年。如果一个系列有出现销售的时间点和没有出现销售的较长时间段,则可以通过将观察到的销售额除以无销售期间的数量来将销售额转换为每个时期的销售额,从而获得一个比率。然后,可以确定销售率和最终以预测率和预测间隔之间的销售间隔之间的模型。您可以在 autobox.com 和谷歌“间歇性需求”中找到更多相关信息 如果一个系列有出现销售的时间点和没有出现销售的较长时间段,则可以通过将观察到的销售额除以无销售期间的数量来将销售额转换为每个时期的销售额,从而获得一个比率。然后,可以确定销售率和最终以预测率和预测间隔之间的销售间隔之间的模型。您可以在 autobox.com 和谷歌“间歇性需求”中找到更多相关信息 如果一个系列有出现销售的时间点和没有出现销售的较长时间段,则可以通过将观察到的销售额除以无销售期间的数量来将销售额转换为每个时期的销售额,从而获得一个比率。然后,可以确定销售率和最终以预测率和预测间隔之间的销售间隔之间的模型。您可以在 autobox.com 和谷歌“间歇性需求”中找到更多相关信息