我一直在寻找一篇首次提出基尼重要性的论文,但我不确定这是否真的是这样。
这是我熟悉并希望在论文中找到的公式:
在哪里
= 特定节点的样本数
= 总样本数
= 杂质
= 右子节点的度量
= 左子节点的度量
如果我理解正确,这是 sklearn 的随机森林也使用的公式model.feature_importances_
标签(因为我还没有创建新的代表):特征重要性分数,基尼重要性
我一直在寻找一篇首次提出基尼重要性的论文,但我不确定这是否真的是这样。
这是我熟悉并希望在论文中找到的公式:
在哪里
= 特定节点的样本数
= 总样本数
= 杂质
= 右子节点的度量
= 左子节点的度量
如果我理解正确,这是 sklearn 的随机森林也使用的公式model.feature_importances_
标签(因为我还没有创建新的代表):特征重要性分数,基尼重要性