首先,对不起,如果这是一个简单的问题。我被要求研究一些临床流行病学。互联网是我唯一的支持团体,因为我不是专家监督下的学生。
我正在对药物列表(分类)执行 Cox 回归,并且正在调整协变量年龄(其中包括性别、收入等)。我不确定是否应该将年龄视为分类或定量协变量。
根据我的基本理解,年龄通常被视为定量变量,而分类变量将是“你是吸烟者吗?”,是/否。最喜欢的颜色?等等
首先,调查药物对 R 的影响:
coxph(Surv(time,status)~drug,data=coxDF)
coef exp(coef) se(coef) z p
drugNamecodeine_based 0.150117 1.161970 0.022199 6.762 1.36e-11
drugNameporpranolol 0.237963 1.268662 0.023608 10.080 < 2e-16
drugNameparacetamol 0.202408 1.224347 0.021519 9.406 < 2e-16
然后,通过将年龄视为定量来控制患者的年龄:
coxph(Surv(time,status)~drug+age,data=coxDF)
coef exp(coef) se(coef) z p
drugNamecodeine_based 0.1393446 1.1495202 0.0222008 6.277 3.46e-10
drugNameporpranolol 0.1849390 1.2031450 0.0236432 7.822 5.20e-15
drugNameparacetamol 0.1939401 1.2140235 0.0215203 9.012 < 2e-16
adjustedAge -0.0225542 0.9776982 0.0005415 -41.650 < 2e-16
将年龄视为一个定量变量会对所服用的药物进行一些细微的调整。然而,这是有道理的,如果我控制一个分类年龄,我不仅可以获得与年龄相关的风险细分(以年为单位),而且对每种药物的调整也是不同的。
coxph(Surv(time,status)~drug+as.factor(age),data=coxDF)
coef exp(coef) se(coef) z p
drugNamecodeine_based 0.14077 1.15116 0.02222 6.334 2.38e-10
drugNameporpranolol 0.18819 1.20706 0.02367 7.949 1.88e-15
drugNameparacetamol 0.19453 1.21474 0.02155 9.028 < 2e-16
as.factor(adjustedAge)19 0.04519 1.04622 0.07329 0.617 0.537554
as.factor(adjustedAge)20 0.08761 1.09157 0.06905 1.269 0.204510
as.factor(adjustedAge)21 0.02948 1.02992 0.07030 0.419 0.674937
....
....
as.factor(adjustedAge)38 -0.48611 0.61501 0.06367 -7.635 2.26e-14
as.factor(adjustedAge)39 -0.54026 0.58260 0.06362 -8.492 < 2e-16
as.factor(adjustedAge)40 -0.48973 0.61279 0.06416 -7.633 2.29e-14
as.factor(adjustedAge)41 -0.46459 0.62839 0.06286 -7.391 1.46e-13
as.factor(adjustedAge)42 -0.57269 0.56401 0.06272 -9.131 < 2e-16
我真的很喜欢我可以看到每个年龄的计算。但是,就药物的结果而言,我不确定将年龄变量视为正确与否。
而且,值得注意的是,一个病人只被观察一次。所以他们的年龄与时间无关。
总结一下我的主要问题:
1)我现在可以看到与每一年组相关的风险似乎很好,但是,为什么这会改变每种药物在年龄之间的 exp(coef)被视为定量和分类?
2)如果我想在测量特定药物对患者时间结果的影响时控制年龄,这应该是定量的还是分类的?
3)如果我对与患者年龄相关的风险(而不是他们拥有什么药物)更感兴趣,那么我肯定需要将年龄视为分类变量吗?我会只用 ~age 进行单独的计算吗?
非常感谢您的帮助。
编辑 1 回复非常好,最有用。原谅我对统计的基本理解。从它的声音来看,我将年龄视为一个定量协变量。
我不明白的是,除了那些友好地回复我的帖子的人之外,我也无法问专家,为什么我要在我的模型中添加二次项或三次项?这将实现什么?
![线性模型]](https://i.stack.imgur.com/tEDv9.png?s=256)
