机器算法验证 - 多元多级面板回归中的双指数平滑 - 吾爱随笔录

我想使用双指数平滑来预测奥地利联邦州的护理依赖流行率。

我的数据非常详细，因此我想利用它来完善我的预测。我有 9 个奥地利联邦州 50-99 岁的 1-7 岁护理依赖人群的百分比。

 str(daten[1:12][daten$jahr>1996,])
'data.frame':   39600 obs. of  12 variables:
 $ age       : num  50 51 52 53 54 55 56 57 58 59 ...
 $ gender    : Factor w/ 2 levels "male","female": 1 1 1 1 1 1 1 1 1 1 ...
 $ bundesland: Factor w/ 9 levels "Bgld","Ktn","Noe",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ jahr      : num  1997 1997 1997 1997 1997 ...
 $ PfSt0     : num  0.992 0.989 0.985 0.985 0.985 ...
 $ PfSt1     : num  0.001458 0.000967 0.001459 0 0.002199 ...
 $ PfSt2     : num  0.00437 0.00193 0.00802 0.00793 0.00587 ...
 $ PfSt3     : num  0.00146 0.0058 0.00073 0.00433 0.0044 ...
 $ PfSt4     : num  0.000729 0 0.002188 0.002163 0.000733 ...
 $ PfSt5     : num  0 0.000967 0.002188 0.000721 0.002199 ...
 $ PfSt6     : num  0 0.000967 0 0 0 ...
 $ PfSt7     : num  0 0 0.00073 0 0 ...

DES是一种时间序列分析方法。时间序列分析仅通过数据序列的过去值来解释数据序列。虽然我确实只使用了过去的护理依赖数据，但可以将年龄、性别和联邦州视为解释变量。我可以假设这些时间序列内的结构一致性，而不是计算每个年龄、性别、联邦州组合的单个双指数平滑预测。因此，我的数据可能被视为多级面板数据集，每年有 50 个观察值（年龄组）嵌套在 9 个联邦州。（我计划对男性和女性进行单独的回归。）

我想使用联邦州、年龄和年龄平方作为解释变量，除了以前的值和以前的趋势，就像在双指数平滑中所做的那样。

然而，在面板数据分析中，时间趋势通常通过在回归中包含年份变量来涵盖，而很少包含滞后。如何在面板数据集中实现类似于双指数平滑的预测方法，即还包括其他解释变量？（最好在 R 中）

（由于我有 7 个而不是 1 个因变量，事情变得更加复杂。）