多元多级面板回归中的双指数平滑

机器算法验证 r 时间序列 面板数据 趋势
2022-03-22 09:00:19

我想使用双指数平滑来预测奥地利联邦州的护理依赖流行率。

我的数据非常详细,因此我想利用它来完善我的预测。我有 9 个奥地利联邦州 50-99 岁的 1-7 岁护理依赖人群的百分比。

 str(daten[1:12][daten$jahr>1996,])
'data.frame':   39600 obs. of  12 variables:
 $ age       : num  50 51 52 53 54 55 56 57 58 59 ...
 $ gender    : Factor w/ 2 levels "male","female": 1 1 1 1 1 1 1 1 1 1 ...
 $ bundesland: Factor w/ 9 levels "Bgld","Ktn","Noe",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ jahr      : num  1997 1997 1997 1997 1997 ...
 $ PfSt0     : num  0.992 0.989 0.985 0.985 0.985 ...
 $ PfSt1     : num  0.001458 0.000967 0.001459 0 0.002199 ...
 $ PfSt2     : num  0.00437 0.00193 0.00802 0.00793 0.00587 ...
 $ PfSt3     : num  0.00146 0.0058 0.00073 0.00433 0.0044 ...
 $ PfSt4     : num  0.000729 0 0.002188 0.002163 0.000733 ...
 $ PfSt5     : num  0 0.000967 0.002188 0.000721 0.002199 ...
 $ PfSt6     : num  0 0.000967 0 0 0 ...
 $ PfSt7     : num  0 0 0.00073 0 0 ...

DES是一种时间序列分析方法。时间序列分析仅通过数据序列的过去值来解释数据序列。虽然我确实只使用了过去的护理依赖数据,但可以将年龄、性别和联邦州视为解释变量。我可以假设这些时间序列内的结构一致性,而不是计算每个年龄、性别、联邦州组合的单个双指数平滑预测。因此,我的数据可能被视为多级面板数据集,每年有 50 个观察值(年龄组)嵌套在 9 个联邦州。(我计划对男性和女性进行单独的回归。)

我想使用联邦州、年龄和年龄平方作为解释变量,除了以前的值和以前的趋势,就像在双指数平滑中所做的那样。

然而,在面板数据分析中,时间趋势通常通过在回归中包含年份变量来涵盖,而很少包含滞后。如何在面板数据集中实现类似于双指数平滑的预测方法,即还包括其他解释变量?(最好在 R 中)

(由于我有 7 个而不是 1 个因变量,事情变得更加复杂。)

1个回答

双指数平滑可以看作是卡尔曼滤波器的简化版本。它不是最优的,但可以更健壮。您可以尝试在 R 中进行卡尔曼滤波。