当我在 AZURE 机器学习中部署我的 Web 服务时,我的测试数据集中是否可以有 NULL 或空?或者我必须填写所有信息才能得到我的预测结果?
已部署的 Web 服务
数据挖掘
天蓝色毫升
2022-02-16 11:56:33
1个回答
在训练集中:
您最好使用一些方法来“假定”某些值......平均/按比例......您可以在各种学习资源中找到
将它们留空(不确定 Azure,但在低级编程平台中)会导致不准确或问题。
对于测试集:
您没有更改学习参数,但这可能会导致一些不准确的测量,但 Azure ML 可能在内部做了一些事情。
来自MSDN的参考:
如何处理缺失值?
处理缺失值,最好先找出缺失值的原因,以便更好地处理问题。典型的缺失值处理方法有:
- 删除:删除缺失值的记录
- 虚拟替换:用虚拟值替换缺失值:例如,未知用于分类或 0 用于数值。
- 均值替换:如果缺失数据是数字,则用均值替换缺失值。
- 频繁替换:如果缺失的数据是分类的,用最频繁的项目替换缺失值
- 回归替换:使用回归方法将缺失值替换为回归值。
其它你可能感兴趣的问题