我试图找到这个问题的答案无济于事。它类似于这个问题,但并不完全相同。
我有一个发生在零和一之间的连续因变量(一些数据点恰好落在零和一上)。我想拟合一个形回归。我的数据是关于珊瑚礁的,的死亡百分比。我没有成功和失败的频率计数,只有覆盖率的死亡率。
logit在这里是一个糟糕的主意吗?由于我只有两个 sig-figs,将 80% 的死亡率变成 100 次观察中的 80 次是一个坏主意吗?还有其他一些我可以探索的 sigmoid 函数吗?
我试图找到这个问题的答案无济于事。它类似于这个问题,但并不完全相同。
我有一个发生在零和一之间的连续因变量(一些数据点恰好落在零和一上)。我想拟合一个形回归。我的数据是关于珊瑚礁的,的死亡百分比。我没有成功和失败的频率计数,只有覆盖率的死亡率。
logit在这里是一个糟糕的主意吗?由于我只有两个 sig-figs,将 80% 的死亡率变成 100 次观察中的 80 次是一个坏主意吗?还有其他一些我可以探索的 sigmoid 函数吗?
我不认为@O_Devinyak 建议的 beta 回归适用于这种情况,因为数据中有确切的 0 和 1,并且 beta 分布仅适用于但不包括 0 和 1 之间的值。
在经济学中越来越流行的一个解决方案是所谓的分数 logit 模型,经济学家倾向于将其归因于 Papke 和 Wooldridge (1996),尽管其基本思想至少可以追溯到 Wedderburn (1974)。如今,估计这样的模型相当容易。例如,在 Stata(我最了解的统计程序)中,您可以将该glm
程序与link(logit) family(binomial) vce(robust)
选项结合使用。
Wedderburn, RW 1974。拟似然函数、广义线性模型和高斯-牛顿法。生物计量学,61(3):439-447。
Papke、Leslie E. 和 Jeffrey M. Wooldridge。1996. 分数响应变量的计量经济学方法与 401(k) 计划参与率的应用。应用计量经济学杂志,11(6):619-632。