我正在尝试解决一个涉及面板数据研究中缺失数据的估算的问题(不确定我是否正确使用了“面板数据研究”,正如我今天所学到的那样。)我拥有2003年的总死亡计数数据到2009年,所有8个地区和4个年龄段的男性和女性的所有月份。
数据框看起来像这样:
District Gender Year Month AgeGroup TotalDeaths
Northern Male 2006 11 01-4 0
Northern Male 2006 11 05-14 1
Northern Male 2006 11 15+ 83
Northern Male 2006 12 0 3
Northern Male 2006 12 01-4 0
Northern Male 2006 12 05-14 0
Northern Male 2006 12 15+ 106
Southern Female 2003 1 0 6
Southern Female 2003 1 01-4 0
Southern Female 2003 1 05-14 3
Southern Female 2003 1 15+ 136
Southern Female 2003 2 0 6
Southern Female 2003 2 01-4 0
Southern Female 2003 2 05-14 1
Southern Female 2003 2 15+ 111
Southern Female 2003 3 0 2
Southern Female 2003 3 01-4 0
Southern Female 2003 3 05-14 1
Southern Female 2003 3 15+ 141
Southern Female 2003 4 0 4
在2007年和2008年的10个月中,未记录所有地区的总死亡人数。我正在尝试通过多重插补方法估算这些缺失值。使用广义线性模型或SARIMA模型。
我最大的问题是软件和编码的使用。我问了一个关于Stackoverflow的问题,我想将数据提取到较小的组中,例如:
District Gender Year Month AgeGroup TotalDeaths
Northern Male 2003 1 01-4 0
Northern Male 2003 2 01-4 1
Northern Male 2003 3 01-4 0
Northern Male 2003 4 01-4 3
Northern Male 2003 5 01-4 4
Northern Male 2003 6 01-4 6
Northern Male 2003 7 01-4 5
Northern Male 2003 8 01-4 0
Northern Male 2003 9 01-4 1
Northern Male 2003 10 01-4 2
Northern Male 2003 11 01-4 0
Northern Male 2003 12 01-4 1
Northern Male 2004 1 01-4 1
Northern Male 2004 2 01-4 0
即将
Northern Male 2006 11 01-4 0
Northern Male 2006 12 01-4 0
但是有人建议我宁愿在这里提出我的问题-也许问一个方向?目前,我无法作为R的适当时间序列/面板研究来输入此数据。我的最终目标是使用此数据及其amelia2
包及其功能来估算TotalDeaths
2007年和2008年某些月份的丢失情况,其中失踪。
我们将不胜感激任何帮助,如何做到这一点,以及关于如何解决该问题的建议。
如果这有帮助,我将尝试采用类似于克林特·罗伯茨(Clint Roberts)在其博士论文中所做的方法。
编辑:
在按照@Matt的建议创建'time'和'group'变量之后:
> head(dat)
District Gender Year Month AgeGroup Unnatural Natural Total time group
1 Khayelitsha Female 2001 1 0 0 6 6 1 Khayelitsha.Female.0
2 Khayelitsha Female 2001 1 01-4 1 3 4 1 Khayelitsha.Female.01-4
3 Khayelitsha Female 2001 1 05-14 0 0 0 1 Khayelitsha.Female.05-14
4 Khayelitsha Female 2001 1 15up 8 73 81 1 Khayelitsha.Female.15up
5 Khayelitsha Female 2001 2 0 2 9 11 2 Khayelitsha.Female.0
6 Khayelitsha Female 2001 2 01-4 0 2 2 2 Khayelitsha.Female.01-4
如您所见,实际上还有“自然”和“非自然”的更多细节。
Amelia
了一段时间,但放弃了(在此之前)。我以前看过该小插图(但是以某种方式丢失了它!)只是快速浏览了一下,并将逐步通过。我现在遇到的一个问题是,我不确定如何创建group
和time
变量。(我尝试创建它们以进行时间序列分析/预测,但周围有一个循环。)我确定它在vigette中-因此,如果遇到麻烦,我会尽快与您联系。再次感谢:)