我基本上是在寻找以下情况(故障诊断问题)的方法、模型、算法:
我有一个输入集和案例的二进制特征(想想触发的“故障”或“警报”)和类。每个案例可以属于至少一个类,最多属于(所以我正在处理多标签分类)。
现在数据集中的一些关系完全无聊/没有信息(比如,特征说“发生机械错误”并贴上标签表示“已修复机械错误”)。但更一般地说,每当,我看到各种标签,即不是预测性的。换句话说,这种关系不是“功能性的”。
其他输入功能可能具有更“功能性”的性质,因此无论何时, 我很容易推断.
例如,我的训练集可能如下所示:
所以,知道不是真正的信息,而告诉我(非常有把握地)标签 1 处于活动状态。
我正在寻找后面的对,一个只提取有意义的对并忽略无信息输入的分类器。
你能给我指出相关的技术/关键词吗?非常感谢!