我应该修改数据集吗?

数据挖掘 数据集 特征选择
2022-02-28 10:03:01

我正在研究一个包含 80 多个特征和数千个实例的数据集。在这些特征中,有一些名义上的特征,例如 IP SOURCE、IP DESTINATION、Flow ID,它们对我的机器学习模型没有任何意义。我的问题是,我应该手动删除这些功能,还是必须用数字替换它们的值?

1个回答

您不需要从数据集中删除您的功能,您可以只删除您不希望将其视为功能或标签的功能。通过在将数据拟合到训练集中时排除列来删除特征或标签。

我在上面显示的项目中使用了它