是否可以通过潜在变量获得逻辑回归的预测区间?

机器算法验证 物流 二进制数据 潜变量 预测区间 分位数回归
2022-04-07 16:57:38

carbocation询问如何计算逻辑回归的预测区间答案是预测区间对逻辑回归没有意义,因为响应变量只取两个值,所以预测区间总是相同的。

Carl提出了一个后续问题,将其修改为“是否有......一种明智的方法来计算对数奇数空间中的预测区间? ”,即线性预测器上的预测区间 - 或它的一些单调变换. (他想将预测区间从线性预测器的对数几率尺度转换为概率尺度。)

在我看来,答案分为两个阵营:

  1. 它仍然是一个二元结果:根据定义,这些基本上是说预测区间是关于结果值的分布,并且由于只有两个结果值,预测区间的概念要么不适用,要么基本上没有用。
  2. 置信区间:这些基本上表明卡尔想要的等于线性预测变量的置信区间。我认为这是不对的,因为如果您将线性回归的置信区间作为类比,那么它是关于以预测变量为条件的平均值的分布,而卡尔的问题是关于个别情况的值的分布。

我有一个建议,可能是朝着回答这些问题迈出的一步。

[我提出这个问题是因为我不知道我的建议是否有效(因此,它是否构成答案),而且我没有足够的声誉点来将其发布为对我之前的问题的评论有引用。另外,我的最后一点是问题。]

我想知道卡尔的问题是否可以如下处理:

  • 假设存在一个潜在变量,它是每种情况的真实对数赔率
  • 使每个案例的响应是从一组二元结果中随机抽取的,概率由真实对数赔率确定。

生成与此概念模型一致的模拟数据非常容易。如果存在真实对数赔率的预测变量并且在模拟数据中可观察到真实对数赔率,则可以建立回归模型,根据预测变量预测真实对数赔率,并且可以计算真实对数赔率的预测区间log-odds,这将与置信区间不同。这些预测区间似乎正是 Carl 想要的。

然而,如果真正的对数赔率是不可观察的并且只有随机二进制结果是可观察的:

  1. 是否可以估计一个将真实对数赔率视为潜在变量的模型?
  2. 如果是这样,这与逻辑回归有何不同?
  3. 这种形式的模型有标准名称吗?
  4. 二元结果分位数回归是否符合我们的要求?例如http://econpapers.repec.org/article/wlyjapmet/v_3a27_3ay_3a2012_3ai_3a7_3ap_3a1174-1188.htm,https://www.researchgate.net/publication/229676506_Binary_quantile_regression_a_Bayesian_approach_based_on_the_asymmetric_Laplace_distribution_
0个回答
没有发现任何回复~