Cox PH 模型中的误差项解释

机器算法验证 生存 计量经济学 cox模型 错误 比例风险
2022-03-16 09:46:38

我正在准备关于生存分析模型的演讲,特别关注 Cox 模型。假设我在简单的双变量生存分析案例中(与x1x2)。危险率的 Cox 模型函数形式为:

h(t|x1,x2)=h0(t)exp(x1β1+x2β2).

我的问题是:如果你必须向对计量经济学/统计学有较好理解的研究生解释误差项是如何进入函数形式的,你会怎么做?

2个回答

这是一个非常古老的问题,但仍然没有答案。

这个问题的简单答案是,在其原始公式中(在离散时间和后来的连续时间中),Cox 模型没有误差项。这意味着个体异质性的所有来源都被可观察特征的向量捕获,X.

这显然是极其严格的,因为我们知道实际上存在许多无法观察到的危险变化来源。Lancaster (1979)通过引入乘法误差项(并为其假设参数形式)将 Cox 模型推广到包括未观察到的异质性(脆弱性)。

h(t|x,v)=h0(t)exp(Xβ)v

多年来,这种混合比例风险模型已经以多种方式进行了修改。尤其是计量经济学家,不喜欢函数形式假设,并且大量文献朝着放松与误差项规范相关的假设的方向发展v并尽可能保持h0(t)半参数或非参数识别。

请参阅Hausman 和 Woutersen (2014)的引言,以获得对关键相关论文的参考的优秀评论。

这篇论文本身提供了一个很好的例子,说明了计量经济学这一领域的最新成果。混合比例风险是从数据中唯一确定的,无需诉诸任何函数形式假设v也不h0(t). 实现这一目标的主要假设是 PH 假设和随时间变化的外部回归变量的存在(即与v),其变体用于识别所有其他模型组件。

使用时变协变量进行识别可以追溯到 Heckman 和 Honore 的旧作品(您也可以在 Hausman 和 Woutersen (2014) 论文中找到对他们工作的参考)。

请注意,右侧回归量的因果解释具有挑战性,因为通常很难相信右侧回归量和v(因为这是一个根本无法检验的假设)。

您似乎将 Cox 比例风险模型与线性高斯模型混淆了。Cox 模型不需要误差项。这样做的结果是,一个省略的变量可能会破坏βs 在模型中,与正常回归不同,当省略与其他项正交的项时。