在scikit-learn 文档和决策树学习维基百科文章中提到“有些概念很难学习,因为决策树不容易表达它们,例如 XOR、奇偶校验或多路复用器问题。 ”
我不记得知道这样的问题类型。
此类问题的示例(以及可能相关的数据集)是什么?
在scikit-learn 文档和决策树学习维基百科文章中提到“有些概念很难学习,因为决策树不容易表达它们,例如 XOR、奇偶校验或多路复用器问题。 ”
我不记得知道这样的问题类型。
此类问题的示例(以及可能相关的数据集)是什么?
下面是用于分类的 XOR 数据集的示例。如您所见,决策树在此数据集上的表现非常差。原因是决策树将空间分割成矩形区域。因此,它们对这种分布不太好。
如果你真的想在这种情况下使用树,使用所谓的旋转树会很有趣。旋转是关于在学习树的同时对输入特征执行 PCA(主成分分析)。使用它,决策树可以构建非矩形区域。
此外,这里是一个测试梯度提升算法的游乐场,包括 XOR 数据集。这真的很有趣!您可以单击“旋转树”来激活旋转。 梯度提升游乐场