我有一个像下面这样没有标签的数据集
但是在专家意见的帮助下,我们根据以下 3 条规则生成标签(必须满足所有 3 条规则才能将其标记为 1)
所以现在数据集如下所示
如您所见,我的最终数据集具有标签。
现在我可以运行 ML 模型进行分类。我对吗?
但我读到,在模型构建过程中,必须排除用于创建标签的特征,因为它们可能会导致类的完美分离,而模型可能会失败。失败是什么意思?我们的目标不是通过分类算法进行分类吗?
我可以知道为什么我们必须排除这些特征(例如:用于派生标签的 RG、FG 和 BP 特征)?
基本上我的模型将建立在下面的数据集上。但我们不会失去预测能力吗?为什么我们必须通过排除那些特征(用于派生标签)来构建模型?



