在基于集成的方法的上下文中,无法弄清楚硬投票和软投票之间的区别
在我看来,他们正在做同样的事情。
在硬投票中,voting_classifier 计算每个 class_instance 的数量,然后将由大多数分类器投票的类分配给 test_instance。在软计算中,有一个概率项,它取每个类的概率平均值,然后用它来对 test_instance 进行分类。
它们彼此有何不同?任何数学公式等可以使它们之间的区别更加明显?
对于软投票分类器,我还读到“它赋予高度自信的投票更多的权重”。它是如何在数学上实现的。是作者所说的加权平均值还是其他什么?