我正在做一个与根据他/她过去的记录预测下一个葡萄糖值相关的项目。但在一些患者中,一些录音丢失了。我的数据集中缺少血糖值有两种情况。因此,在我的示例中,我将它们标记为场景 1 和场景 2。
情景 - 1
- 患者在第30天基本上在早餐、午餐和晚餐之前记录了每天三次的葡萄糖值。但在第31天他只记录了早餐和晚餐。第 31 天没有记录午餐。那么我们如何将午餐中的 0 值替换为另一个值?
情景 - 2
- 另一位患者从第1天到第40天连续记录血糖值,然后又连续2天没有记录血糖值(早餐前、午餐前和晚餐前第41天和第42天没有记录) )。他再次开始记录第 43 天的值。那么解决这种情况的最佳方法是什么?
我浏览了许多文章,大部分都解释了如何替换空记录的众数、中值或平均值。但我认为模式,中位数不适合这种数据集。我非常怀疑我是否也可以使用平均值来替换Scenario-1中的空记录值。我们实际上可以使用 mean 来替换Scenario - 1中的空记录,还是有其他好的方法?
据我所知,我认为我不能使用上述三种方法来替换Scenario - 2中的值,因为缺少大约 6 条记录。如果我是正确的,那么Scenario-2的最佳方法是什么。
谢谢!!!