假设我们遇到了以下问题:
预测未来 3 个月内哪些客户最有可能停止在我们的商店购买。
对于每个客户,我们知道他们开始在我们的商店购买的月份,此外,我们在每月汇总中还有许多行为特征。“最年长”的客户已经购买了 50 个月; ( )表示客户开始购买的时间。可以假设客户端的数量非常大。如果客户停止购买三个月然后回来,那么他将被视为新客户,因此事件(停止购买)只能发生一次。
我想到了两个解决方案:
逻辑回归- 对于每个客户和每个月(可能是最近的 3 个月除外),我们可以判断客户是否停止购买,因此我们可以对每个客户和每个月进行一次观察进行滚动样本。我们可以使用自开始以来的月数作为分类变量来获得一些等价的基本风险函数。
扩展的 Cox 模型- 这个问题也可以使用扩展的 Cox 模型来建模。看来这个问题更适合生存分析。
问题:生存分析在类似问题中的优势是什么?生存分析是出于某种原因发明的,所以一定有一些严重的优势。
我在生存分析方面的知识不是很深,我认为 Cox 模型的大多数潜在优势也可以使用逻辑回归来实现。
- 和分层变量 的交互作用可以获得分层 Cox 模型的等价物。
- 交互 Cox 模型可以通过将种群划分为几个子种群并估计每个子种群的 LR 来获得。
我看到的唯一优势是 Cox 模型更灵活;例如,我们可以很容易地计算出客户在 6 个月内停止购买的概率。