首先,我有相当深厚的数学背景,但我从未真正处理过时间序列或统计建模。所以你不必对我很温柔:)
我正在阅读这篇关于商业建筑能源使用建模的论文,作者提出以下主张:
[自相关的出现]是因为模型是从能源使用的时间序列数据发展而来的,这本质上是自相关的。时间序列数据的任何纯确定性模型都将具有自相关性。如果模型中包含[更多傅立叶系数],则发现自相关会降低。然而,在大多数情况下,傅立叶模型的 CV 较低。因此,对于不要求高精度的实际目的,该模型可能是可以接受的。
0.)“时间序列数据的任何纯确定性模型都将具有自相关”是什么意思?我可以模糊地理解这意味着什么——例如,如果你的自相关为 0,你会如何预测时间序列中的下一个点?可以肯定,这不是一个数学论证,这就是为什么这是 0 :)
1.)我的印象是自相关基本上杀死了你的模型,但仔细想想,我不明白为什么会这样。那么为什么自相关是一件坏事(或好事)?
2.)我听说过处理自相关的解决方案是区分时间序列。如果不尝试阅读作者的想法,如果存在不可忽略的自相关,为什么不做差异呢?
3.) 不可忽略的自相关对模型有什么限制?这是某个地方的假设(即,使用简单线性回归建模时的正态分布残差)?
无论如何,对不起,如果这些是基本问题,并提前感谢您的帮助。