-1 最喜欢的投票我有一个数据集,其中包括大多数变量的缺失数据。假设数据集如下:
Obs. var1 var2 var3 var4 var5 var6
1 x11 x12 x13 x14 Nan Nan
2 x21 x22 x23 Nan x25 x26
3 x31 x32 x33 x34 x35 x36
...
n xn1 xn2 xn3 xn4 Nan xn6
我已将数据集拆分为 d1 ,其中我们拥有所有变量的完整数据,而 d2 则所有记录都至少有一个缺失变量。
我使用 KNN 制作了不同的模型:为了预测第一次观察的 var5 和 var6 的值,我使用了 d1(没有缺失值的数据集)并以 var1、var2、var3 和 var4 为模型。
为了预测最后一次观察的 var5 的值,我使用了 d1 并以 var1、var2、var3、var4 和 var5 为模型。
我的方法有意义吗?!欢迎任何建议。谢谢你。