我正在准备关于生存分析模型的演讲,特别关注 Cox 模型。假设我在简单的双变量生存分析案例中(与和)。危险率的 Cox 模型函数形式为:
我的问题是:如果你必须向对计量经济学/统计学有较好理解的研究生解释误差项是如何进入函数形式的,你会怎么做?
我正在准备关于生存分析模型的演讲,特别关注 Cox 模型。假设我在简单的双变量生存分析案例中(与和)。危险率的 Cox 模型函数形式为:
我的问题是:如果你必须向对计量经济学/统计学有较好理解的研究生解释误差项是如何进入函数形式的,你会怎么做?
这是一个非常古老的问题,但仍然没有答案。
这个问题的简单答案是,在其原始公式中(在离散时间和后来的连续时间中),Cox 模型没有误差项。这意味着个体异质性的所有来源都被可观察特征的向量捕获,.
这显然是极其严格的,因为我们知道实际上存在许多无法观察到的危险变化来源。Lancaster (1979)通过引入乘法误差项(并为其假设参数形式)将 Cox 模型推广到包括未观察到的异质性(脆弱性)。
多年来,这种混合比例风险模型已经以多种方式进行了修改。尤其是计量经济学家,不喜欢函数形式假设,并且大量文献朝着放松与误差项规范相关的假设的方向发展并尽可能保持半参数或非参数识别。
请参阅Hausman 和 Woutersen (2014)的引言,以获得对关键相关论文的参考的优秀评论。
这篇论文本身提供了一个很好的例子,说明了计量经济学这一领域的最新成果。混合比例风险是从数据中唯一确定的,无需诉诸任何函数形式假设也不. 实现这一目标的主要假设是 PH 假设和随时间变化的外部回归变量的存在(即与),其变体用于识别所有其他模型组件。
使用时变协变量进行识别可以追溯到 Heckman 和 Honore 的旧作品(您也可以在 Hausman 和 Woutersen (2014) 论文中找到对他们工作的参考)。
请注意,右侧回归量的因果解释具有挑战性,因为通常很难相信右侧回归量和(因为这是一个根本无法检验的假设)。
您似乎将 Cox 比例风险模型与线性高斯模型混淆了。Cox 模型不需要误差项。这样做的结果是,一个省略的变量可能会破坏s 在模型中,与正常回归不同,当省略与其他项正交的项时。