不同于 0 和 1 的边界的逻辑回归

机器算法验证 物流
2022-04-13 03:04:56

我有一些数据;它是某些东西相对于所有事物的比例,因此根据定义,它的界限在 0 和 1 之间。比例随时间而变化。除了相当高的方差外,在时间段的中间还有一个阶梯状的变化;这个步骤不是很大,但它就在那里,并且相对于整个时间段发生得相当快。所以我有一个 S 曲线,我想(并且被告知)做逻辑回归。y

但是:(1)这不是单调的,甚至不是接近的,因为方差很大。(2) 它不是从 0 到 1。而是从大约 0.2 到大约 0.8,如果你看一下平均值。所以看起来正确的做法是拟合类似东西,其中是通常的逻辑 S 曲线,所以我们总共有 4 个参数。aϕ(x)+bϕ

困扰我的是,我从未见过这样使用逻辑回归的例子(我承认没有看到太多)。并不是说我不确定如何实现这一点——我非常有信心我能弄清楚这一点,尽管具体的指针会受到赞赏——但我担心数据受到限制的假设S 曲线对于之后的所有估计都很重要,例如拟合优度、步骤的显着性、置信区间等。

所以:

  1. 我的担心有道理吗?
  2. 你能指出文献中的一个相关例子吗?不一定是统计文献,如果一些生物学家(或任何人)使用它,那很好。甚至只是有人提到这种可能性。
  3. 如果这种方法确实存在问题,有哪些替代方法?

更新:嗯,我太无​​知了,我什至不能正确地问问题。我正在寻找多项式(又名多头)回归。

2个回答

您正在寻找错误的关键字。逻辑回归适用于 0-1 结果,其中 1 的概率是用 S 形(逻辑)函数建模的,而不是实际数据点本身。寻找非线性回归,特别是四参数逻辑模型:(它可以与其他参数化一起出现)。如果你搜索这个模型,你会发现很多与 ELISA 相关的东西。y=A+(BA)/(1+exp((a+bx)))+ϵ

有专门的软件来拟合这个,当然主要的统计软件包也可以处理。不幸的是,如果有很多可变性,估计可能会很困难,并且拟合过程可能“不会收敛”。

首先,我认为我们必须区分逻辑回归和(广义)逻辑函数尽管后者可以被视为前者将时间作为唯一解释变量的单独案例。然后很容易看出,拟合过程将通过时到达其上限(或可能是下限)因此,沿着曲线移动是随时间上下变化的过协变量(不是时间)的影响(在消费结构中,这些是收入、品味、价格等)。所以可能会出现跳跃或其他情况,因为没有人将线性回归限制为仅上升或仅下降到StSS曲线的边界。

由于您正在使用结构是自然限制。当您的结论仅基于历史数据分析时,您永远无法确定任何其他界限在未来不会更高或更低,并且认为该过程从未这样做是不合适的推理。因此,您的担心是不合理的,逻辑回归(但不适合逻辑曲线!作为确定性微分方程的解!)在这里可以正常工作。请注意,可能有几个类别最多为 1,因此您需要多项 logit 模型来适应这种情况下的结构。01

在备选方案中,可能有任何模型可以应用于离散选择常用的候选者是概率和 logit 模型。即使您认为我的模型中没有决策,实际上世界上的所有结构都是人类、自然或外星人解决决策过程的结果^_^。