最近,我对实现一个 beta 回归模型感兴趣,以获得一个比例的结果。请注意,此结果不适合二项式上下文,因为在此上下文中没有有意义的离散“成功”概念。实际上,结果实际上是持续时间的比例;分子是特定条件处于活动状态时的秒数,超过该条件有资格处于活动状态的总秒数。我为变幻莫测表示歉意,但我不想过多地关注这个精确的背景,因为我意识到除了 beta 回归之外,还有多种方法可以对这样的过程进行建模,现在我对理论更感兴趣在我尝试实施这样一个模型时出现的问题(当然,我是
在任何情况下,我能够找到的所有资源都表明 beta 回归通常适合使用 logit(或 probit/cloglog)链接,并且参数被解释为对数赔率的变化。但是,我还没有找到一个参考,它实际上提供了任何真正的理由来说明为什么要使用这个链接。
最初的 Ferrari & Cribari-Neto (2004) 论文没有提供理由;他们只注意到 logit 函数“特别有用”,因为对指数参数的优势比解释。其他来源暗示希望从区间 (0,1) 映射到实线。但是,考虑到我们已经假设了一个 beta 分布,我们是否一定需要一个链接函数来进行这样的映射?除了假设 beta 分布所施加的约束之外,链接函数提供了哪些好处?我已经进行了几次快速模拟,并且没有看到具有身份链接的 (0,1) 区间之外的预测,即使从概率质量很大程度上集中在 0 或 1 附近的 beta 分布进行模拟时也是如此,但也许是我的模拟还不够笼统,无法捕捉到一些病状。
在我看来,基于个人在实践中如何解释来自 beta 回归模型的参数估计(即优势比),他们隐含地对“成功”的几率进行推断;也就是说,他们正在使用 beta 回归作为二项式模型的替代品。考虑到 beta 分布和二项分布之间的关系,这在某些情况下可能是合适的,但在我看来,这应该是一种特殊情况,而不是一般情况。在这个问题中,提供了一个答案来解释相对于连续比例而不是结果的优势比,但在我看来,尝试以这种方式解释事物似乎是不必要的麻烦,而不是使用例如对数或身份链接并解释百分比变化或单位变化。
那么,为什么我们将 logit 链接用于 beta 回归模型?是否只是为了方便,将其与二项式模型联系起来?