我们应该使用哪种技术来预测整数输出?

数据挖掘 机器学习 神经网络 分类 回归 线性回归
2022-02-27 08:03:14

我正在解决一个问题,我的目标特征是整数类型。即(n_clicks)。一般来说,如果我们想预测分类目标特征,那么我们使用分类算法,另一方面,为了预测连续类型的目标特征,我们使用回归技术,其中我的输出将是 -infinity 到 +infinity。但在我的情况下,如果我使用回归,那么我的输出将变成一个浮点值。这里的一种解决方案是将输出浮点值转换为整数或使用 pandas.round() 对值进行四舍五入。

有没有其他方法可以将我的输出变量预测为整数?

谢谢

更新:建议使用泊松回归,尝试下面的代码,但输出仍然相同。下面是代码片段:

import statsmodels.api as sm
x_train_sm = sm.add_constant(x_train)
poisson_model = sm.GLM(y_train, x_train_sm, family=sm.families.Poisson()).fit()

在此处输入图像描述 在此处输入图像描述

2个回答

如果您使用的是泊松回归模型,这个问题可能更适合交叉验证,因为它是一个统计模型。

这似乎与您获得浮点数而不是预期整数值的原因有关。泊松回归返回期望值 E[Y|X],不一定是整数。

https://stackoverflow.com/questions/49416697/statsmodel-poisson-prediction-return-floats-instead-of-whole-numbers

当因变量是计数时,泊松回归是一个合适的选择。