Beta 回归(即具有 Beta 分布的 GLM,通常是 logit 链接函数)通常被推荐用于处理取值在 0 和 1 之间的响应(也称为因变量),例如分数、比率或概率:结果的回归(比率或分数)在 0 和 1 之间。
但是,总是声称一旦响应变量至少一次等于 0 或 1,就不能使用 beta 回归。如果是这样,则需要使用零/一膨胀的 beta 模型,或者对响应进行一些转换等:包括 1 和 0 的比例数据的 Beta 回归。
我的问题是:beta 分布的哪个属性阻止 beta 回归处理精确的 0 和 1,为什么?
我猜是这样和不支持 beta 分发。但对于所有形状参数和, 0 和 1都支持 beta 分布,只有较小的形状参数,分布在一侧或两侧趋于无穷大。也许样本数据是这样的和提供最佳拟合结果都高于.
这是否意味着在某些情况下,即使使用零/一,实际上也可以使用 beta 回归?
当然,即使 0 和 1 在 beta 分布的支持下,恰好观测到 0 或 1 的概率也为零。但是观察任何其他给定的可数集的概率也是如此,所以这不是问题,不是吗?(参见@Glen_b 的评论)。
在 beta 回归的背景下,beta 分布的参数化方式不同,但具有它仍然应该在对全部.