已部署的 Web 服务

数据挖掘 天蓝色毫升
2022-02-16 11:56:33

当我在 AZURE 机器学习中部署我的 Web 服务时,我的测试数据集中是否可以有 NULL 或空?或者我必须填写所有信息才能得到我的预测结果?

1个回答

在训练集中:

您最好使用一些方法来“假定”某些值......平均/按比例......您可以在各种学习资源中找到

将它们留空(不确定 Azure,但在低级编程平台中)会导致不准确或问题。

对于测试集:

您没有更改学习参数,但这可能会导致一些不准确的测量,但 Azure ML 可能在内部做了一些事情。

来自MSDN的参考:

如何处理缺失值?

处理缺失值,最好先找出缺失值的原因,以便更好地处理问题。典型的缺失值处理方法有:

  • 删除:删除缺失值的记录
  • 虚拟替换:用虚拟值替换缺失值:例如,未知用于分类或 0 用于数值。
  • 均值替换:如果缺失数据是数字,则用均值替换缺失值。
  • 频繁替换:如果缺失的数据是分类的,用最频繁的项目替换缺失值
  • 回归替换:使用回归方法将缺失值替换为回归值。