为什么我们要对数据进行去季节化?

机器算法验证 回归 季节性
2022-03-28 08:41:34

我正在阅读一篇文章,其中作者声称她所研究的年度天气数据的平均值和标准偏差随着年份的变化而变化;即,每年都有不同的平均值和标准差。(她没有提到她发现了多少变化。)

作者没有深入研究这个话题,但她确认这些值需要去季节化,以便时间序列从非平稳变为平稳。

问题是她没有给出统计上的理由。例如,“数据集的均值和标准差相差太大”或“季节性掩盖了其他重要因素”。她干脆做到了。很可能很容易理解她为什么这样做,但由于我对这一切都不熟悉,这对我来说毫无意义。

我在谷歌上搜索了这个主题,寻找一个直接而简单的答案,但没有成功。

我还想知道如果数据中嵌入了季节性,为什么首先要对数据进行去季节性处理?它不是数据的重要组成部分吗?一个重要的“趋势”?

2个回答

当重点放在长期趋势上时,你会去季节化。例如,您对销售的去向感兴趣,而不是下个月的销售情况。销售通常具有很强的季节性,例如房屋销售在夏季上升,在冬季下降。

因此,如果您的重点是确定销售的总体趋势是否上升,您就会淡化季节性因素,并且可能会忘记季节性因素。但是,如果您需要预测下一季度的销售额,则需要同时考虑长期趋势和季节性。您可以通过单独或汇总分析组件来做到这一点。在后一种情况下,您不必费心去季节化。

另见“为什么要调整?” “季节性:因果关系、解释和影响”中的部分,Granger,网址:http ://www.nber.org/chapters/c4321

您只能使用非季节性数据制作回归线。然后可以使用回归线方程来进行去季节化的未来预测。从这里你可以找到季节性的未来值。所以也许这样做是为了预测未来的价值?

不过,我不太确定这与固定和非固定数据之间的关系。