我有一个面板成本数据,其中包含一些零值(不是缺失值,而是四舍五入为 0)。当我将 SAS Proc Glimmix 与 Gamma 分布一起使用时,我应该如何处理零?也许将零更改为非常小的值?还是在 PROC GLIMMIX 中有一个选项(我找不到)?
珍妮
我有一个面板成本数据,其中包含一些零值(不是缺失值,而是四舍五入为 0)。当我将 SAS Proc Glimmix 与 Gamma 分布一起使用时,我应该如何处理零?也许将零更改为非常小的值?还是在 PROC GLIMMIX 中有一个选项(我找不到)?
珍妮
我认为您应该考虑使用泊松模型。在Stata 博客上讨论了它何时工作以及何时不作为连续模型的近似值。如果值限制在 0 到 100 的范围内,您还可以使用它进行二项式回归。
如果零是数据的一小部分,我只需将它们移动到一个小的正值(也许是最小正观察的一半)。
如果零点的数量接近数据的 10%,我想做一些更复杂的事情,比如将结果视为 0 处的 gamma 和点质量的混合。