0 到 1 之间的连续因变量拟合 sigmoidal 函数

机器算法验证 广义线性模型 罗吉特
2022-04-06 17:20:28

我试图找到这个问题的答案无济于事。它类似于这个问题,但并不完全相同。

我有一个发生在零和一之间的连续因变量(一些数据点恰好落在零和一上)。我想拟合一个形回归。我的数据是关于珊瑚礁的,的死亡百分比我没有成功和失败的频率计数,只有覆盖率的死亡率。SY2

logit在这里是一个糟糕的主意吗?由于我只有两个 sig-figs,将 80% 的死亡率变成 100 次观察中的 80 次是一个坏主意吗?还有其他一些我可以探索的 sigmoid 函数吗?

1个回答

我不认为@O_Devinyak 建议的 beta 回归适用于这种情况,因为数据中有确切的 0 和 1,并且 beta 分布仅适用于但不包括 0 和 1 之间的值。

在经济学中越来越流行的一个解决方案是所谓的分数 logit 模型,经济学家倾向于将其归因于 Papke 和 Wooldridge (1996),尽管其基本思想至少可以追溯到 Wedderburn (1974)。如今,估计这样的模型相当容易。例如,在 Stata(我最了解的统计程序)中,您可以将该glm程序与link(logit) family(binomial) vce(robust)选项结合使用。

Wedderburn, RW 1974。拟似然函数、广义线性模型和高斯-牛顿法。生物计量学,61(3):439-447。

Papke、Leslie E. 和 Jeffrey M. Wooldridge。1996. 分数响应变量的计量经济学方法与 401(k) 计划参与率的应用。应用计量经济学杂志,11(6):619-632。