我提交了一篇文章,由于执行生存分析的方式不正确而被拒绝。裁判没有留下其他细节或解释,除了:“时间趋势的生存分析需要更复杂的审查方式。”
问题:
在过去的几十年中,吸烟者的过度死亡风险是否降低了?
数据:
德国有 25.000 名吸烟者。他们在 1995 年至 2014 年之间的任何时间都被纳入该队列。每个吸烟者(在登记时)都与来自普通人群(不吸烟)的性别和年龄匹配的对照组相匹配。对于在整个研究期间死亡的每个人,我都有确切的死亡时间。那些在后续行动中没有死亡的人将被审查。该研究旨在检查 1995 年至 2014 年每年吸烟者的过度死亡风险。
目的是计算:
- 每年吸烟者和非吸烟者的死亡率并检查这些趋势
- 每年(或连续几年)吸烟者的过度死亡风险。
应该如何分析数据?回想一下,1998 年的某个人可能会在 2015 年去世。使用计数过程格式的正确方法是否每年都更新开始和停止?
这是裁判不喜欢的方法:
通过泊松回归计算发病率。我们将随访时间作为模型中的偏移量,并将年龄、性别、吸烟状况和日历期(连续两年)作为模型中的预测因子。然后使用 R 的 predict() 函数计算每 1000 人年的比率。偏移量(随访时间)是从登记开始的人的整个观察时间(天)。
Cox 模型用于估计从研究开始到结束的每个时期吸烟者的相对风险。为简单起见,我们将第一期的风险比与最后一期的风险比进行了比较。
问题: - 一个人(连同他的控制权)可能包括在 1998 年,因此属于该日历组,但在 2006 年遭受了一个事件。 - 应该如何布置数据以分析 Poisson 和 Cox 回归?考克斯的计数过程?什么是开始和停止时间?- 在这种情况下如何评估趋势?
一些澄清:假设一名患者于 1998 年 6 月 15 日首次被观察并经历了 1998 年 12 月 31 日的事件,我们的时间变量的值是 730 天中的 182.5 天,因为时间段由随后的 2 年组成。每个时间段的最大观察时间为 730 天。
当患者在一个时间段被观察但在另一个时间段被审查(即经历和事件或退出)时,应将观察到的天数添加到下一个时间段还是什么?
因此,主要问题是后续时间和日历年的处理(用作分类变量,由连续两年组成)。