我有两年的一千名成员的历史健康索赔数据。根据这两年的数据,我必须预测所有成员在第 3 年的住院时间。这是数据样本。
Year MembID x1 x2 x3 x4 x5 x6 x7 LengthOfStay
2010 1 6 35 0 3 0 0 4 1
2010 1 8 35 0 5 0 0 3 0
2009 1 5 35 0 5 0 0 3 3
2009 1 3 35 0 8 2 0 8 0
2010 2 6 30 0 3 3 2 4 0
2010 2 8 30 0 5 0 0 3 0
2009 2 5 30 0 5 0 0 3 0
2010 2 5 30 1 5 0 2 2 0
2009 3 5 55 1 5 1 2 2 0
2010 3 10 55 1 5 0 2 2 0
2010 3 5 55 1 5 1 2 2 0
2009 3 10 55 1 5 0 0 2 0
2010 4 5 24 1 5 0 0 2 0
2009 4 3 24 1 8 0 0 2 0
2009 5 10 65 1 5 1 2 4 5
2009 5 5 65 1 5 0 2 3 0
2010 5 6 65 1 3 0 0 4 1
2010 5 4 65 1 5 0 0 4 0
2010 6 10 44 1 5 1 2 4 5
2011--- i expect------ 1
我用随机森林做了分类。我如何才能进一步预测 2011 年?