如何让随机森林更易于解释?

机器算法验证 机器学习 随机森林
2022-03-22 16:36:27

是否有任何方法可以用来使随机森林更具解释性?随机森林的性能比 CART 好得多,但它的可解释性要差得多。

2个回答

CART 的结果可以很容易地改变(具有实际的样本量),而对数据的扰动很小。如果是这样的话,似乎解释并不像看起来那样简单。我经常听到我的一些同事因为解释困难而避免使用随机森林。它们更多地用于预测。即使是出现的可变重要性度量也是基于预测性能,但它们确实有助于解释。

对于森林中的每棵树,您都有一个终端节点的解释。因此,森林可以看作是向量 x 可能属于 y 类的一系列解释。那么合理解释数量最多的类就是被选中的类。这不是很容易理解吗?