我在 [0,1] 中有一些数据,我想用 beta 回归进行分析。当然,需要做一些事情来适应 0,1 值。我不喜欢修改数据以适应模型。我也不认为零通胀和 1 通胀是一个好主意,因为我相信在这种情况下,人们应该认为 0 是非常小的正值(但我不想确切地说什么值是合适的。一个合理的选择我相信会选择像 .001 和 .999 这样的小值,并使用 beta 的累积距离来拟合模型。所以对于观察 y_i,对数似然 LL_i 将是
if y_i < .001 LL+=log(cumd_beta(.001))
else if y_i>.999 LL+=log(1.0-cum_beta(.999))
else LL+=log(beta_density(y_i))
我喜欢这个模型的地方在于,如果 beta 回归模型是有效的,这个模型也是有效的,但它消除了对极值的一些敏感性。然而,这似乎是一种很自然的方法,我想知道为什么我在文献中找不到任何明显的参考资料。所以我的问题不是修改数据,为什么不修改模型。修改数据会使结果产生偏差(基于原始模型有效的假设),而通过合并极值来修改模型不会使结果产生偏差。
也许我忽略了一个问题?