熵和偏差有什么区别?

机器算法验证 数据挖掘 大车
2022-03-01 03:19:37

在使用决策树的分类任务方面,这些公式看起来几乎相同。那么,它们有何不同/相同?每个杂质测量的目的是什么?

Entropy (p1,p2)=pilog(pi);i=1,2;

pi是分数。说,如果我在一个节点中有 2 是和 3 否,p1=2/5p2=3/5

Deviance D=2nklog(pk); k是每个叶子中的类。

两者都用作杂质措施。但我无法理解这些之间的区别。

1个回答

他们是一样的。这是作者之间的命名差异。基尼是不同的。使用您的符号它将是1pi2