我正在尝试解决一个问题,该问题涉及面板数据研究中缺失数据的估算(不确定我是否正确使用了“面板数据研究” - 正如我今天所知道的那样。)我有 2003 年的总死亡人数数据到 2009 年,所有月份,男性和女性,8 个不同的地区和 4 个年龄组。
数据框看起来像这样:
District Gender Year Month AgeGroup TotalDeaths
Northern Male 2006 11 01-4 0
Northern Male 2006 11 05-14 1
Northern Male 2006 11 15+ 83
Northern Male 2006 12 0 3
Northern Male 2006 12 01-4 0
Northern Male 2006 12 05-14 0
Northern Male 2006 12 15+ 106
Southern Female 2003 1 0 6
Southern Female 2003 1 01-4 0
Southern Female 2003 1 05-14 3
Southern Female 2003 1 15+ 136
Southern Female 2003 2 0 6
Southern Female 2003 2 01-4 0
Southern Female 2003 2 05-14 1
Southern Female 2003 2 15+ 111
Southern Female 2003 3 0 2
Southern Female 2003 3 01-4 0
Southern Female 2003 3 05-14 1
Southern Female 2003 3 15+ 141
Southern Female 2003 4 0 4
在 2007 年和 2008 年的 10 个月中,所有地区的一些总死亡人数没有记录。我试图通过多重插补方法来估计这些缺失值。使用广义线性模型或 SARIMA 模型。
我最大的问题是软件的使用和编码。我在 Stackoverflow 上提出了一个问题,我想将数据提取到较小的组中,例如:
District Gender Year Month AgeGroup TotalDeaths
Northern Male 2003 1 01-4 0
Northern Male 2003 2 01-4 1
Northern Male 2003 3 01-4 0
Northern Male 2003 4 01-4 3
Northern Male 2003 5 01-4 4
Northern Male 2003 6 01-4 6
Northern Male 2003 7 01-4 5
Northern Male 2003 8 01-4 0
Northern Male 2003 9 01-4 1
Northern Male 2003 10 01-4 2
Northern Male 2003 11 01-4 0
Northern Male 2003 12 01-4 1
Northern Male 2004 1 01-4 1
Northern Male 2004 2 01-4 0
即将
Northern Male 2006 11 01-4 0
Northern Male 2006 12 01-4 0
但有人建议我宁愿把我的问题带到这里——也许问个方向?目前我无法将这些数据作为适当的时间序列/面板研究输入 R。我的最终目标是使用这些数据及其功能的包来估算2007 年和 2008 年某些月份amelia2
的缺失,其中数据是TotalDeaths
失踪。
任何帮助,如何做到这一点,也许关于如何解决这个问题的建议将不胜感激。
如果这有帮助,我将尝试采用与 Clint Roberts 在他的博士论文中所做的类似的方法。
编辑:
按照@Matt 的建议创建“时间”和“组”变量后:
> head(dat)
District Gender Year Month AgeGroup Unnatural Natural Total time group
1 Khayelitsha Female 2001 1 0 0 6 6 1 Khayelitsha.Female.0
2 Khayelitsha Female 2001 1 01-4 1 3 4 1 Khayelitsha.Female.01-4
3 Khayelitsha Female 2001 1 05-14 0 0 0 1 Khayelitsha.Female.05-14
4 Khayelitsha Female 2001 1 15up 8 73 81 1 Khayelitsha.Female.15up
5 Khayelitsha Female 2001 2 0 2 9 11 2 Khayelitsha.Female.0
6 Khayelitsha Female 2001 2 01-4 0 2 2 2 Khayelitsha.Female.01-4
如您所见,实际上还有更多细节“自然”和“非自然”。