可以在 Python/scikit-learn 中使用 Poisson、Gamma 或 Tweedie 分布作为误差分布族来评估 GLM?

机器算法验证 广义线性模型 Python scikit-学习 梯度下降 tweedie-distribution
2022-03-15 05:38:28

尝试学习一些 Python 和 Sklearn,但对于我的工作,我需要运行回归,使用来自 Poisson、Gamma,尤其是 Tweedie 系列的误差分布。

我在文档中没有看到任何关于它们的内容,但它们位于 R 发行版的几个部分中,所以我想知道是否有人在任何地方看到过 Python 的实现。如果您能指出 Tweedie 发行版的 SGD 实现,那就太酷了!

2个回答

scikit -learn 中使用 Poisson、gamma 和 Tweedie 误差分布来实现广义线性模型是有进展的。

Statsmodels实现了具有泊松、特威迪和伽马误差分布的广义线性模型。

在我更新这个答案时,Spark ML还(实验性地)支持 Poisson、Tweedie 和 gamma 分布。

H2O 具有广义线性模型

他们使用 H2O Frames,所以你不能直接使用 Pandas/Numpy。