如何使用*统计测试*验证决策树模型?

数据挖掘 决策树
2022-01-26 19:22:28

我正在阅读 sklearn 决策树参考页。

在优势部分,提到“可以使用统计测试验证模型。这使得考虑模型的可靠性成为可能。

有人可以解释执行哪些统计测试来验证 DT 模型吗?

2个回答

我假设您暂时使用 DT 进行二进制分类我学习的第一个测试之一(并且仍然很好)是2x2 列联表或频率表或边际频率或 2 维表(许多名称意味着它已经存在了一段时间)。它使用简单,可以分支到许多其他测试和领域。如;

  • Phi 关联系数
  • 联想卡方检验
  • Fisher 精确概率检验
  • 准确度和精度
  • F-score 或 F-measure,...(仅举几例)

我通常喜欢卡恩学院而不是维基百科(讨厌他们的解释)。

我得到了问题的答案。我从声明中理解的是 DT 模型的验证意味着 DT 中的分裂标准是由统计测试而不是Gini Index, Entropy/Information Gain决定的。有关更多信息,可以参考

我发现了 DT 分裂的另一种观点。