如果一个时间序列有多次缺失数据,最好估算先前观察的平均值吗?
如何处理时间序列中的缺失数据
机器算法验证
时间序列
缺失数据
2022-04-17 02:45:19
2个回答
这是Shumway 和 Stoffer 的 EM 算法的一个很好的应用。
首先您需要指定您的 arima 模型,然后您可以使用卡尔曼滤波器,因为它可以处理缺失值(请参阅Durbin 和 Koopman 教科书)。
对于起始参数值,您可以计算缺失值的预期值,然后在给定缺失值的情况下最大化参数并进行迭代。
这在状态空间模型章节的http://www.amazon.com/Time-Analysis-Its-Applications-Statistics/dp/144197864X第 344 页中有很好的解释。
我希望它有帮助!
我建议研究多种插补算法。Gary King 为 R 制作了一个名为Amelia的包,它可以进行非常复杂的多重插补,并且可以很好地处理时间序列。Amelia 将所有数据视为多元正态分布,并从该分布中执行多次随机抽取,直到抽取收敛于最终估算值。但是您可以合并许多自定义功能,以便您可以针对您的特定问题塑造 Amelia 运行,例如包括滞后、领先和多项式表达式。
其它你可能感兴趣的问题