应用 Lasso 对特征进行排序,得到以下结果:
rank feature prob.
==================================
1 a 0.1825477951589229
2 b 0.07858498115577893
3 c 0.07041793111843796
请注意,数据集有 3 个标签。不同标签的特征排名相同。
然后将随机森林应用于相同的数据集:
rank feature score
===================================
1 b 0.17504808300002753
6 a 0.05132699243632827
8 c 0.041690685195283385
请注意,排名与 Lasso 生成的排名非常不同。
如何解释差异?这是否意味着基础模型本质上是非线性的?