数据挖掘 - 如何使用零膨胀负二项式回归进行二元分类任务？ - 吾爱随笔录

我正在研究二进制分类问题，目前正在使用 XGBoost。数据集由几个变量组成，这些变量是计数变量。问题是，这些功能在数量上存在很大偏差。例如，这些是变量之一的每个值的计数：

0.0     98.175855
1.0      1.275902
2.0      0.348707
3.0      0.199535

这里建议我应用零膨胀泊松或零膨胀负二项式回归模型。我想知道这些模型是如何工作的。

如果有人可以建议一个很好的参考来直观地理解这些模型，那将非常有帮助。