时间是来自现实世界的概念。然而,在数学和统计学中,我们对数字进行操作。作为数学抽象的数字何时对应于“时间”?任何包含数值变量的数据集都可以按该变量排序。该变量甚至可以标记为,但仅此一项不应使集合成为时间序列。
是一个时间序列:
- 数据集本身的属性;或者
- 基于我们的领域知识,我们对生成数据的过程的假设;或者
- 一个标签,我们通过它来证明选择分析数据的工具是合理的;或者
- 别的东西(什么?);或者
- 以上的组合?
为了更清楚我的困惑是什么,下面是一些示例,以及我对它是否是时间序列的猜测:
- 布朗运动:粒子在时间上的位置部分取决于其在. 时间序列。
- 月亮亮度:当时的亮度取决于月球与太阳和地球的相对位置。这个位置是时间的函数,但时间与亮度无关。不是时间序列。
- 流行:当时的感染人数部分取决于当时的感染人数,因为已经感染的人会进一步传播感染。时间序列。
- 多年来的道路事故死亡人数:死亡人数取决于汽车安全(安全带、安全气囊等)、道路质量、治安等。这些都随着时间而变化,但时间和过去的数字都不是造成当前数字的原因. 不是时间序列。
所以,如果我上面的猜测是正确的,那么“时间序列”似乎是一个因果关系的问题。如果过去实现了一个随机变量,对其未来价值有因果影响,这是一个时间序列。如果对过去和未来的价值观有混淆,那就不是时间序列。然而,一般来说,我们事先并不知道因果关系和混杂因素(而且通常甚至在完成统计分析之后也不知道)。因此,我们不知道是否应该将数据集视为时间序列。
或者,如果时间可以用作未知混杂因素的代理,我们是否已经将数据视为时间序列?(在这种情况下,我上面的四个例子都是时间序列)。
或者。我在一条完全错误的道路上吗?