回归范围在 -1 和 1 之间

机器算法验证 回归 荟萃分析 贝塔回归
2022-03-23 05:44:26

我正在对啮齿动物丰度对明确伐木的反应进行荟萃分析。我有来自多个地点、多年和不同种类啮齿动物的数据,并正在使用这些数据来比较明确的啮齿动物的丰度与附近未伐木的“控制”地点的啮齿动物的丰度。

预测变量是空地的大小(例如,1ha、2ha 等)。响应变量计算为处理(即明确)位点和对照位点之间的丰度比例差异,如下所示: 此响应变量是荟萃分析中的常见选择,并导致一个介于 -1 和 1 之间的变量。NTNC

R=(NTNC)(NT+NC)

我想知道是否有可以模拟这种关系的回归模型,类似于逻辑回归模型。一个简单的线性回归可以工作,但我想知道是否还有其他选择。如果可能,我更愿意使用不需要我转换数据的模型

2个回答

您始终可以使用beta 回归(Ferrari 和 Cribari-Neto,2004)。这是一个响应变量的模型,以为界,但是您可以通过使用轻松转换变量(我知道您说过您不想转换,但这是一个非常基本的转型)。(0,1)Y+12

此外,这样的模型仍然非常有意义,因为您正在估计的是由均值和精度参数化的非标准 beta 分布的平均值。通过使用上述转换,标准 beta 回归模型可用于具有任何边界的变量μiϕ(a,b)

g(μi)=xiTβyiabaB(μi,ϕ)

其中是链接函数(例如逻辑函数)。这样的模型相当于g

h(μi)=xiTβyiBa,b(μi,ϕ)

其中中的 beta 分布,是用于从给定范围映射的链接函数(例如,逻辑或双曲正切函数一起重新缩放和移位,如果需要)。Ba,b(a,b)h


Ferrari, S. 和 Cribari-Neto, F. (2004)。用于建模率和比例的 Beta 回归。应用统计杂志,31(7),799-815。

现在有一个经典 Beta 回归的提议改进,称为“增强型 Beta 回归”,这可能在该具有位置数据的元分析中有价值。

根据这篇 2013 年的研究文章,可在线引用,部分内容:

在统计文献中,β 回归已被确立为一种强大的技术来模拟百分比和比例 [10]。此外,该方法已被用于各种研究领域 [3]、[8]、[12]。然而,在某些应用中,经典的 beta 回归方法仍然存在许多限制:

  1. 科学数据库通常涉及大量可能包含在回归模型中的潜在预测变量。因此,如果使用最大似然估计来拟合 beta 回归模型,则模型可能变得过于复杂,从而可能过度拟合数据。这通常会导致较大的方差和预测变量-响应关系的高度不确定性。因此,需要在 beta 回归模型中进行变量选择的技术。

  2. 统计模型经常遇到多重共线性问题,这意味着预测变量是高度相关的。此外,响应变量的观察可能会受到空间相关性的影响,例如,这是生态学中的一个常见问题 [13]、[14]。迄今为止,这些问题尚未纳入 beta 回归方法。

  3. 在许多应用中,预测-响应关系本质上是非线性的[15],[16]。这意味着经典 beta 回归模型的线性预测器需要被更灵活的函数替换,该函数允许对非线性预测器效应进行适当量化。尽管 Simas 等人。[17] 最近提出了一种将非线性效应纳入 beta 回归模型的方法,这种方法需要预先指定预测因子-响应关系(例如,二次或指数)的函数形式。在预测器效应的函数形式未知的情况下,需要一种基于平滑非线性效应的更灵活的方法。

  4. 基于二项式模型的百分比结果通常过于分散,这意味着它们显示出比二项式分布预期的更大的可变性。经典的 beta 回归模型通过包含一个精度参数来调整百分比结果的条件方差,从而方便地解释过度离散(详见下一节)。另一方面,经常观察到过度离散取决于一个或多个预测变量的值[17]。在 beta 回归模型的上下文中,这意味着它不是常数,而是需要回归到预测变量。这个问题使变量选择更加复杂,因为分析师需要识别影响的预测变量。

我欢迎对文章声称的意见。

披露:我不拥有上述作者或销售此软件或其他竞争软件的供应商,也不与之有任何关系。