基于集成的方法中的硬投票与软投票

机器算法验证 机器学习 集成学习
2022-04-01 02:21:45

在基于集成的方法的上下文中,无法弄清楚硬投票和软投票之间的区别

在我看来,他们正在做同样的事情。

在硬投票中,voting_classifier 计算每个 class_instance 的数量,然后将由大多数分类器投票的类分配给 test_instance。在软计算中,有一个概率项,它取每个类的概率平均值,然后用它来对 test_instance 进行分类。

它们彼此有何不同?任何数学公式等可以使它们之间的区别更加明显?

对于软投票分类器,我还读到“它赋予高度自信的投票更多的权重”。它是如何在数学上实现的。是作者所说的加权平均值还是其他什么?

1个回答

假设你有概率:

0.45 0.45 0.90

然后硬投票会给你 1/3 的分数(1 票赞成,2 票反对),所以它会被归类为“否定”。

软投票将为您提供概率的平均值,即 0.6,并且将是“正数”。

软投票考虑了每个选民的确定性,而不仅仅是来自选民的二进制输入。