我想知道 GBM 包中的n.minobsinnode参数是什么意思。我阅读了手册,但不清楚它的作用。该数字应该小还是大以改善结果?
GBM的n.minobsinnode参数在R中的作用
机器算法验证
r
助推
2022-02-11 17:15:55
1个回答
在 GBM 算法的每一步,都会构建一个新的决策树。生长决策树时的问题是“何时停止?”。您可以走的最远的是拆分每个节点,直到每个终端节点中只有 1 个观察值。这将对应于 n.minobsinnode=1。或者,当每个节点中有一定数量的观察值时,节点的分裂可以停止。R GBM 包的默认值为 10。
什么是最好的使用价值?这取决于数据集以及您是在进行分类还是回归。由于每棵树的预测被视为终端节点中所有输入的因变量的平均值,因此值 1 可能不适用于回归(!),但可能适用于分类。
较高的值意味着较小的树,因此使算法运行得更快并使用更少的内存,这可能是一个考虑因素。
一般来说,结果对这个参数不是很敏感,并且考虑到 GBM 性能的随机性,实际上可能很难准确确定什么值是“最佳”。一般来说,交互深度、收缩和树的数量都将更加重要。
其它你可能感兴趣的问题