因此,我们有可能开发出一种机器学习应用程序,该应用程序非常适合分类器解决的传统问题域,即,我们有一组描述项目的属性和它们最终进入的“桶”。然而,与其创建模型对于朴素贝叶斯或类似分类器中的概率,我们希望我们的输出是一组大致人类可读的规则,最终用户可以查看和修改。
关联规则学习看起来像是解决此类问题的算法家族,但这些算法似乎专注于识别特征的常见组合,并且不包括这些特征可能指向的最终桶的概念。例如,我们的数据集如下所示:
Item A { 4-door, small, steel } => { sedan }
Item B { 2-door, big, steel } => { truck }
Item C { 2-door, small, steel } => { coupe }
我只想要“如果它是大的和两门的,那就是卡车”的规则,而不是说“如果它是一个四门的它也很小”的规则。
我能想到的一种解决方法是简单地使用关联规则学习算法并忽略不涉及结束桶的规则,但这似乎有点 hacky。我是否错过了一些算法家族?或者我一开始就错误地解决了这个问题?