优化回归系数以预测最大结果

机器算法验证 回归 分布 预测模型 分位数回归
2022-04-08 06:47:52

当我们对预测较大的边际分布(尾部)值感兴趣时,什么是提高回归系数效率的合理方法?

例如,我们想根据我们的探测器记录的许多协变量来预测地震波。鉴于大多数地震在达到某个协变量阈值后突然发展,因此不能假设数据是严格线性的。绝大多数观察结果不被认为是有害的,在我们的分析中应该降低权重。我们真正感兴趣的是估计更极端的结果。

[想法...] 想到加权最小二乘,但是应该如何计算权重?的分位数回归是更好的方法吗?[/想法]τ=[0.2,0,8]

2个回答

似乎您要么需要放宽协变量的线性假设(例如,使用受限三次样条,即自然样条),要么定义新的最优性标准(最大似然性除外),然后优化拟合。我很高兴您澄清您不想丢弃观察结果。最优性标准将定义有效权重;你不必。

最小二乘法将自动强调拟合更极端值,但会牺牲更高的平均绝对误差或中值绝对误差。Y

您所写的内容表明,关注诊断和残差的逻辑回归将是您的最佳选择。它可以帮助您考虑预测变量和结果之间关系的非线性您需要测试乘法效应(相互作用),因为您谈论的阈值可能是涉及多个预测变量的联合阈值。不过,我对您的陈述感到担忧,即“绝大多数观察结果不被认为是有害的,将从我们的分析中剔除。” 为了解释引起感兴趣事件的原因,绝对有必要了解产生它的条件,就像了解产生它的条件一样。