我想使用以下过程创建一个随机森林:
- 使用信息增益在数据和特征的随机样本上构建树以确定拆分
- 如果叶节点超过预定义的深度,则终止叶节点,或者任何拆分都会导致叶数小于预定义的最小值
- 不是为每棵树分配一个类标签,而是分配叶节点中类的比例
- 在构建了预定义的数量后停止构建树
这以两种方式颠覆了传统的随机森林过程。一,它使用分配比例而不是类标签的修剪树。第二,停止标准是预定数量的树,而不是一些袋外错误估计。
我的问题是这样的:
对于上述输出 N 棵树的过程,我可以使用带 LASSO 选择的逻辑回归拟合模型吗?有没有人有使用逻辑 LASSO 拟合随机森林分类器和后处理的经验?
ISLE 框架提到使用 LASSO 作为回归问题的后处理步骤,而不是分类问题。此外,在谷歌搜索“随机森林套索”时,我没有得到任何有用的结果。