正如标题中所说,平稳性和低自相关是一般/线性回归模型的先决条件吗?也就是说,如果时间序列是非平稳的或具有较大的自相关性,使用线性模型和深度学习等回归模型进行预测是更容易还是更难?
平稳性和低自相关是回归模型的前提吗?
数据挖掘
机器学习
回归
2021-10-12 14:08:22
2个回答
对于(线性)回归模型,以下假设必须成立:
- 线性关系
- 多元正态性包括零均值的误差项 + 服从正态分布的一些无限方差
- 无自相关
- 没有(强)多重共线性
- 没有同方差性
非平稳性(由随时间变化的均值或/和方差引起)在大多数水平数据(例如股票价格)中普遍存在 - 因为它具有单位根或趋势平稳。
在大多数情况下,要消除数据的非平稳性,使用相对变化(百分比变化 - 或日志变化)就足够了。取对数变化,也可以稍微治愈同方差。
要测试平稳性,您可以使用Augmented-Dickey-Fuller-Test,其中 Null 假设表明您的数据集中存在单位根,因此您有一个非平稳变量。
关于时间序列和深度学习的第二个问题。不幸的是,我还没有找到一篇好的论文/文章来讨论对主要数据属性的假设,这些假设必须满足才能获得正确的统计结果。查看我自己的帖子- 尚未回答
然而,由于深度学习模型使用相同的基础统计假设——例如概率分布等,甚至是基础模型(例如线性激活函数)——我猜,在时间序列框架中,相同的假设必须成立,否则,有可能出现虚假回归。
您可以使用回归模型,但对于相关性,如果您使用任何分类列和一个热编码数据,则需要确保正确处理虚拟变量陷阱,因为它会严重影响模型的准确性。请参阅此处以了解更多信息:
其它你可能感兴趣的问题