病例对照研究中的存活率趋势

机器算法验证 回归 生存 发病率比 间隔审查
2022-03-12 23:27:11

我提交了一篇文章,由于执行生存分析的方式不正确而被拒绝。裁判没有留下其他细节或解释,除了:“时间趋势的生存分析需要更复杂的审查方式。”

问题:

在过去的几十年中,吸烟者的过度死亡风险是否降低了?

数据:

德国有 25.000 名吸烟者。他们在 1995 年至 2014 年之间的任何时间都被纳入该队列。每个吸烟者(在登记时)都与来自普通人群(不吸烟)的性别和年龄匹配的对照组相匹配。对于在整个研究期间死亡的每个人,我都有确切的死亡时间。那些在后续行动中没有死亡的人将被审查。该研究旨在检查 1995 年至 2014 年每年吸烟者的过度死亡风险。

目的是计算:

  • 每年吸烟者和非吸烟者的死亡率并检查这些趋势
  • 每年(或连续几年)吸烟者的过度死亡风险。

应该如何分析数据?回想一下,1998 年的某个人可能会在 2015 年去世。使用计数过程格式的正确方法是否每年都更新开始和停止?

这是裁判不喜欢的方法:

通过泊松回归计算发病率。我们将随访时间作为模型中的偏移量,并将年龄、性别、吸烟状况和日历期(连续两年)作为模型中的预测因子。然后使用 R 的 predict() 函数计算每 1000 人年的比率。偏移量(随访时间)是从登记开始的人的整个观察时间(天)。

Cox 模型用于估计从研究开始到结束的每个时期吸烟者的相对风险。为简单起见,我们将第一期的风险比与最后一期的风险比进行了比较。

问题: - 一个人(连同他的控制权)可能包括在 1998 年,因此属于该日历组,但在 2006 年遭受了一个事件。 - 应该如何布置数据以分析 Poisson 和 Cox 回归?考克斯的计数过程?什么是开始和停止时间?- 在这种情况下如何评估趋势?

一些澄清:假设一名患者于 1998 年 6 月 15 日首次被观察并经历了 1998 年 12 月 31 日的事件,我们的时间变量的值是 730 天中的 182.5 天,因为时间段由随后的 2 年组成。每个时间段的最大观察时间为 730 天。

当患者在一个时间段被观察但在另一个时间段被审查(即经历和事件或退出)时,应将观察到的天数添加到下一个时间段还是什么?

因此,主要问题是后续时间和日历年的处理(用作分类变量,由连续两年组成)。

2个回答

综上所述,Cox 模型有几种可能性:

  1. 每个时间段的单独模型:对每个人使用一个观察值;计算观察时间(无论在随访期间何时发生审查/死亡),然后计算每个时期的风险比。然后直接比较风险比。
  2. 分别计算吸烟者和非吸烟者危害的相对变化:每人一次观察;计算观察时间(无论何时发生删失/事件),然后使用模型中的所有患者(从 1995 年到 2014 年),使用时间段作为分类变量,并将其中一个时间段设置为参考值。

    1. 计算过程公式:这听起来很吸引人,但我不确定如何使用生存时间、开始停止间隔和日历年。

尽管过多解读审稿人的含糊评论很危险,但我猜反对意见与审查是否提供信息有关。

生存模型的解释通常基于个人在时间审查T代表所有幸存下来的对象T进入研究后。(措辞改编自生存分析的介绍。)然后审查是非信息性的。

然而,在你的分析中,那些被审查的人是那些幸存到 2014 年的人。如果你认为在过去 20 年中吸烟导致的过度死亡风险发生了变化(或者即使死亡率发生了平行变化对于两组),那么那些被审查的个体可能不能代表那些在同一时间幸存但更早进入研究的人。根据您的假设,审查可能会提供信息。

您的分析设计细节可能避免了这个问题,但在审阅的手稿中并不清楚。或者,审稿人可能出于其他一些原因不喜欢这项研究,并发现这是一种拒绝它的方式,编辑不会质疑。然而,这似乎是对您分析这些数据的方式的潜在反对意见,您应该确保它得到正确处理。(这超出了我的个人专业知识;本网站上的其他人可能对如何进行有指导。这个问题的更准确的标题,以及有关研究设计和分析的更多细节,可能会得到更有帮助的答案。)

从您的问题和澄清评论中,我不清楚 Cox 分析是否为每年(或超过 2 年的间隔)死亡率的简单建模增加了任何有用的东西。另外,您的假设似乎暗示非吸烟者和吸烟者之间的危害随着时间的推移不成比例,这是标准 Cox 分析的基础如果您对作为日历年函数的吸烟者和非吸烟者之间的死亡率差异感兴趣,这是最直接的建模方法(尽管您可能必须考虑研究样本中假定的非吸烟者富集因为他们匹配的吸烟同行死亡)。