mtry的默认/recommended 值对于回归任务是P/3而对于分类任务它是SquareRoot(P)。(其中 P 是变量数)
根据我的理解,RF 背后的基本思想是在随机森林中使用较小的变量子集来创建弱且多样化的分类器,并将它们聚合成一个更强的分类器。
但是我找不到任何关于为什么回归任务默认为 P/3 而不是SquareRoot(P)的具体文档。
它是随机森林特有的吗?如果是,那是什么?
或者
它是否更基本,例如决定 RF 的回归/分类树的性能/构造之间的差异。
我不是在寻找一个完整的简化答案,只是指向正确的文献链接:)
谢谢!