在指数平滑模型系列的背景下,似乎没有处理缺失数据的标准方法。特别是,预测包中称为ets的R 实现似乎只采用最长的子序列而不会丢失数据,以及 Hyndman 等人的“使用指数平滑进行预测”一书。似乎根本没有谈论丢失的数据。
如果我的用户明确要求我做更多的事情(并且如果丢失的数据不会发生得太近或发生在恰好相隔一个季节的太多时期)。特别是,我想到的是以下内容。在模拟过程中,每当我遇到缺失值时, 我会替换当前点预测为了, 以便. 例如,这将使参数优化过程不考虑数据点。
一旦我对参数有一个合理的拟合,我就可以估计误差的标准差(假设是正常的平均值) 并验证使用值从该分布生成的概率不会大大降低可能性。我也会使用这些值进行预测(使用模拟)。
这种方法有已知的陷阱吗?