我想知道XGBoostmin_child_weight
和正则化之间的区别。gamma
据我了解:
- hessian 正则化会阻止单个树 () 从增长(很像限制
max_depth
) - 损失正则化阻止了单个树() 不会被保留在集合中,因为它会惩罚树的数量
但是,我很难从中找到实际意义。我的意思是,是否存在黑森正则化比伽马正则化表现更好(或更差)的情况?还是这一切都取决于数据集和其他超参数值?我的感觉是,当我的模型损失主要是由一些非常不准确的预测引起的 - 那么 hessian 正则化可能比 gamma 更有帮助,并且当我的模型在每次观察中被误认为大约相同的数量时,那么 gamma 会更好。但我很难找出这种感觉的证据。