的scikit-learn
实现DecisionTreeClassifier
有一个参数 as class_weight
。根据文档:
与 {class_label: weight} 形式的类关联的权重。如果没有给出,所有的类都应该有一个权重。
和
“平衡”模式使用 y 的值自动调整权重,与输入数据中的类频率成反比,如 n_samples / (n_classes * np.bincount(y))
我的理解是它应该用于不平衡类的情况。
问题: DT(分类)算法在确定给定节点的理想分割时如何使用此参数?它是否考虑了预测空间中某个区域的某种“加权”多数类而不是简单多数类?