LIME 中的多值分类特征

数据挖掘 分类编码 可解释的ai 酸橙
2022-03-02 18:49:49

我正在使用 Marco Ribeiro ( https://github.com/marcotcr/lime ) 的 LIME 实现。具体来说,我正在使用 LimeTabularExplainer,因为我的数据集中混合了数字和分类特征。我将如何表示在单个示例中可能取 ≥ 0 值的分类特征?我了解 API 需要将分类特征转换为整数表示,但我将如何表示一个分类特征的值组合?为了说明这种情况,请参阅作为图像附加的示例数据集并考虑“合并症”功能。 具有多值分类特征的说明性数据集

我研究的一种方法是将每个值的存在视为其自身的二元分类特征;然而,特征的数量迅速增加,因为我有多个特征,示例采用了许多值的组合。我担心我的方法无法围绕要解释的示例进行有效抽样。我知道 LimeTabularExplainer 要求分类列中的值是整数,但是我如何将这些“多值”分类特征编码为整数?谢谢你考虑我的问题!

0个回答
没有发现任何回复~