我想就手头的问题添加一些想法,以便讨论继续进行。但是,我提出了其他要考虑的问题,因此其他人可能会对此发表评论。
在阅读这篇文章和突出显示的链接中的文章时,我们尝试通过应用另一种方法(例如弹性网络)来克服 RF 中的偏差(可能在尾部)并纠正 RF 的偏差输出。然而,先做一个弹性网,然后做射频,反之亦然,并没有得到一个广受欢迎的解决方案。我们尝试一个接一个地堆叠方法来克服它们的缺点,但没有成功。
在每种方法都对方程式中的所有特征做出承诺之后,问题可能隐藏在两种方法的程序使用中。我不是在这里谈论并行性。我的意思是,如果我们为每一个具有其自身功能的功能提供信息会怎样。
当我们执行 RF 来预测某个函数的结果时,我们尝试使用一种和整个方程进行建模。换句话说,总和树或所有树的意见就如何处理方程中的所有特征得出一个平均结论。弹性网络在选择进行正则化时也是如此。但是我们同时在所有功能上都这样做,这意味着一个或两个功能会因此产生不利影响。总得有人来拔短稻草。f(x)x1x2λ
也许上一张海报所说的Find不是真正的Find,因为它想找到另一种方法来纠正错误行为。也许真正的Find不在于方法的堆叠。如果我们可以通过对每个特征应用一种方法来尝试为每个特征赋予文字会怎样。像。我没有听说过,直到我自己读了它。我说的是微软的解释 ML 包。虽然此刻y=a0∗+a1∗f1(x1)+...+an∗fn(xn)
它只支持树作为基础学习者(Robert Kübler 博士)
它可能会阐明这个问题。
我只是想给出一些想法,我们可能不得不寻找不同的方式,而不是“纠正”我们的路线。
微软论文:
https ://arxiv.org/pdf/1909.09223.pdf
中:
https ://towardsdatascience.com/the-explainable-boosting-machine-f24152509ebb