数据挖掘 - 如何确定替换数据集中空记录的最佳方法？ - 吾爱随笔录

我正在做一个与根据他/她过去的记录预测下一个葡萄糖值相关的项目。但在一些患者中，一些录音丢失了。我的数据集中缺少血糖值有两种情况。因此，在我的示例中，我将它们标记为场景 1 和场景 2。

情景 - 1

患者在第30天基本上在早餐、午餐和晚餐之前记录了每天三次的葡萄糖值。但在第31天他只记录了早餐和晚餐。第 31 天没有记录午餐。那么我们如何将午餐中的 0 值替换为另一个值？

情景 - 2

另一位患者从第1天到第40天连续记录血糖值，然后又连续2天没有记录血糖值（早餐前、午餐前和晚餐前第41天和第42天没有记录））。他再次开始记录第 43 天的值。那么解决这种情况的最佳方法是什么？

我浏览了许多文章，大部分都解释了如何替换空记录的众数、中值或平均值。但我认为模式，中位数不适合这种数据集。我非常怀疑我是否也可以使用平均值来替换Scenario-1中的空记录值。我们实际上可以使用 mean 来替换Scenario - 1中的空记录，还是有其他好的方法？

据我所知，我认为我不能使用上述三种方法来替换Scenario - 2中的值，因为缺少大约 6 条记录。如果我是正确的，那么Scenario-2的最佳方法是什么。

谢谢！！！