时间序列分析的意义何在?

机器算法验证 时间序列 有马
2022-01-29 23:45:26

时间序列分析的重点是什么?

还有许多其他统计方法,例如回归和机器学习,都有明显的用例:回归可以提供有关两个变量之间关系的信息,而机器学习则非常适合预测。

但与此同时,我看不出时间序列分析有什么好处。当然,我可以拟合 ARIMA 模型并将其用于预测,但是当预测的置信区间很大时,这有什么好处呢?尽管股市是世界历史上最受数据驱动的行业,但没人能预测股市是有原因的。

同样,我如何使用它来进一步了解我的流程?当然,我可以绘制 ACF 并去“啊哈!有一些依赖!”,但是然后呢?重点是什么?当然存在依赖性,这就是为什么您要开始进行时间序列分析。你已经知道有依赖但是你打算用它做什么?

4个回答

一个主要用途是. 十多年来,我一直在通过预测超市明天将售出多少单位特定产品来养活我的家人,这样他就可以订购足够的库存,但不要太多。这里面有钱。

其他预测用例在International Journal of ForecastingForesight等出版物中给出。(全面披露:我是Foresight的副主编。)

是的,有时s 很大。(我假设您的意思是 PI,而不是s。它们是有区别的。) 这仅仅意味着这个过程很难预测。然后你需要缓解。在预测超市销售时,这意味着您需要大量安全库存。在预测海平面上升时,这意味着您需要建造更高的堤坝。我想说一个大的预测间隔确实提供了有用的信息。

对于所有预测用例,analyis 很有用,尽管预测是一个更大的话题。您通常可以通过考虑时间序列中的依赖关系来改进预测,因此您需要通过分析来理解它们,这比仅仅知道存在依赖关系更具体。

另外,人们对时间序列感兴趣,即使他们不进行预测。计量经济学家喜欢检测宏观经济时间序列中的变化点。或者评估干预措施(例如税法的变化)对 GDP 或其他方面的影响。您可能想浏览您最喜欢的计量经济学期刊以获得更多灵感。

M. Dettling 的课程幻灯片中的 TS 分析目标:

1)探索性分析:系列属性的可视化

  • 时间序列图
  • 分解为趋势/季节性模式/随机误差
  • 用于理解依赖结构的相关图

2)建模:将随机模型拟合到代表和反映系列最重要属性的数据中

  • 完成探索性或已有知识
  • 模型选择和参数估计至关重要
  • 推理:模型与数据的拟合程度如何?

3) 预测:用不确定性度量来预测未来的观测结果

  • 主要基于模型,使用依赖和过去的数据
  • 是一种外推法,因此经常带着一粒盐
  • 类似于通过后窗后视镜驾驶汽车

4)过程控制:(物理)过程的输出定义了一个时间序列

  • 随机模型拟合观察到的数据
  • 这允许理解信号和噪声
  • 监测正常/异常波动是可行的

5) 时间序列回归:使用 1 个或多个输入序列对响应时间序列进行建模 在 iid 错误假设下拟合此模型:

  • 导致无偏估计,但是...
  • 经常严重错误的标准错误
  • 因此,置信区间和检验具有误导性

关于库存标记问题:

  • 这些 TS 非常不稳定,很难建模。
  • 例如,涉及公司的法律变更可能会导致 TS 流程发生变化……任何统计工具如何预测这一点?

关于序列相关:

  • 与多元统计相比,时间序列中的数据通常不是独立同分布的,而是序列相关的。
  • 此信息也可用于检测不是 iid 的东西,应该是什么,例如肮脏的实验室仪器

回答您的问题的最简单方法是了解数据集通常大致分为横截面时间序列面板横截面回归是横截面数据集的首选工具。这是大多数人都知道并使用术语回归来指代的内容。时间序列回归有时应用于时间序列,但时间序列分析除了回归之外还有广泛的工具。

横截面数据的示例是(x1,y1),(x2,y3),,(xn,yn), 在哪里xi,yi是一所学校随机挑选的学生的体重和身高。当样本是随机的时,我们通常可以运行线性回归yx并获得可靠的结果,也许可以预测身高y^这所学校的一个学生只知道学生的体重x.

在此处输入图像描述

如果样本不是随机的,那么回归可能根本不起作用。例如,您只选择一年级的女孩来估计模型,但您必须预测一名 12 年级男生的身高。因此,即使在横截面设置中,回归也有其自身的问题。

现在,看看时间序列数据,它可能是xt,yt(x1,y1),(x2,y3),,(xn,yn), 在哪里t一年中的一个月,和x,y仍然是这所学校的特定学生的体重和身高。

在此处输入图像描述

通常,回归根本不需要工作。原因之一是指数t被订购。所以你的样本不是随机的,我之前提到回归更喜欢随机样本才能正常工作。这是一个严重的问题。时间序列数据往往是持久的,例如您本月的身高与您下个月的身高高度相关。为了处理这些问题,开发了时间序列分析,它也包括回归技术,但它必须以某些方式使用。

第三种常见的数据集类型是面板,特别是第 i 个纵向数据。在这里,您可能会得到一些学生体重和身高变量的快照。该数据集可能看起来像横截面的波浪或一组时间序列。

在此处输入图像描述

自然,这可能比前两种类型更复杂。在这里,我们使用面板回归和其他为面板开发的特殊技术。

总而言之,与横截面回归相比,时间序列回归被认为是一种独特的工具的原因是,在回归技术的独立性假设方面,时间序列提出了独特的挑战。特别是,由于与横截面分析不同,观察的顺序很重要,它通常会导致各种相关和依赖结构,这有时会使回归技术的应用失效。你必须处理依赖,而这正是时间序列分析擅长的。

资产价格的可预测性

此外,您在重复一个关于股票市场和资产价格的普遍误解,即它们无法预测。这种说法太笼统而不能成立。确实,您无法完全可靠地预测 AAPL 的下一个报价。然而,这是一个非常狭隘的问题。如果你把网撒得更广,你会发现很多利用各种预测(尤其是时间序列分析)来赚钱的机会。统计套利就是这样一个领域。

现在,资产价格短期内难以预测的原因是价格变化的很大一部分是新信息无法从过去实际设计的真正新信息根据定义是无法预测的。然而,这是一个理想化的模型,很多人会争辩说存在允许状态持续存在的异常。这意味着价格变化的部分可以用过去来解释。在这种情况下,时间序列分析非常合适,因为它精确地处理了持久性。它将新与旧分开,新是无法预测的,但旧是从过去拖到未来的。如果你能解释一下,在金融这意味着你可以能够赚钱。只要基于此类预测的策略价格涵盖其产生的收入。

最后,看一下2013 年的诺贝尔经济学奖:“很有可能预见到这些价格在较长时期内的大致走势,例如未来三到五年。” 看看席勒的诺贝尔讲座,他讨论了资产价格的可预测性。

时间序列分析也有助于有效地检测时间数据中的异常或异常值。

例如,可以拟合 ARIMA 模型并计算预测区间。根据用例,间隔可用于设置阈值,在该阈值内可以说过程处于受控状态;如果新数据超出阈值,则将其标记为进一步关注。

这篇博文对异常值检测的时间序列分析进行了简要而广泛的概述。为了进行更深入的处理,ebay 的研究人员解释了他们如何根据时间序列数据的统计分析大规模地进行异常检测。