我对数据科学和机器学习还很陌生,并且一直在尝试更多地阅读一些方法,例如为我正在从事的项目之一进行提升。该项目的调查人员有兴趣将其xgboost用于该项目,但是一旦我们获得数据,我们预计会有几个主要问题。
将存在类别不平衡,例如 1 少于 0。我已经看到人们通过使用scale_pos_weightin 参数来处理这个问题xgboost,但据我了解,它xgboost允许自定义目标函数。我想知道人们如何提出自定义目标函数以及他们选择的目标函数背后的基础。我对一个定制的目标函数感兴趣,它可以更多地惩罚假阴性,并且想知道网络上是否有任何推荐的东西。我们正在处理分类问题,因此默认情况下我们将使用对数损失函数。我希望有某种常用的自定义日志丢失功能。
如果我使用了错误的术语,我深表歉意,因为我对此还是很陌生。非常感谢!