我想使用双指数平滑来预测奥地利联邦州的护理依赖流行率。
我的数据非常详细,因此我想利用它来完善我的预测。我有 9 个奥地利联邦州 50-99 岁的 1-7 岁护理依赖人群的百分比。
str(daten[1:12][daten$jahr>1996,])
'data.frame': 39600 obs. of 12 variables:
$ age : num 50 51 52 53 54 55 56 57 58 59 ...
$ gender : Factor w/ 2 levels "male","female": 1 1 1 1 1 1 1 1 1 1 ...
$ bundesland: Factor w/ 9 levels "Bgld","Ktn","Noe",..: 1 1 1 1 1 1 1 1 1 1 ...
$ jahr : num 1997 1997 1997 1997 1997 ...
$ PfSt0 : num 0.992 0.989 0.985 0.985 0.985 ...
$ PfSt1 : num 0.001458 0.000967 0.001459 0 0.002199 ...
$ PfSt2 : num 0.00437 0.00193 0.00802 0.00793 0.00587 ...
$ PfSt3 : num 0.00146 0.0058 0.00073 0.00433 0.0044 ...
$ PfSt4 : num 0.000729 0 0.002188 0.002163 0.000733 ...
$ PfSt5 : num 0 0.000967 0.002188 0.000721 0.002199 ...
$ PfSt6 : num 0 0.000967 0 0 0 ...
$ PfSt7 : num 0 0 0.00073 0 0 ...
DES是一种时间序列分析方法。时间序列分析仅通过数据序列的过去值来解释数据序列。虽然我确实只使用了过去的护理依赖数据,但可以将年龄、性别和联邦州视为解释变量。我可以假设这些时间序列内的结构一致性,而不是计算每个年龄、性别、联邦州组合的单个双指数平滑预测。因此,我的数据可能被视为多级面板数据集,每年有 50 个观察值(年龄组)嵌套在 9 个联邦州。(我计划对男性和女性进行单独的回归。)
我想使用联邦州、年龄和年龄平方作为解释变量,除了以前的值和以前的趋势,就像在双指数平滑中所做的那样。
然而,在面板数据分析中,时间趋势通常通过在回归中包含年份变量来涵盖,而很少包含滞后。如何在面板数据集中实现类似于双指数平滑的预测方法,即还包括其他解释变量?(最好在 R 中)
(由于我有 7 个而不是 1 个因变量,事情变得更加复杂。)