时间到事件数据和连续数据之间的相关性

数据挖掘 统计数据
2022-02-27 13:27:38

我想测量作为事件数据时间的生存时间与以连续规模测量的患者活动计数之间的相关性。什么类型的相关系数可以用来衡量这两个变量的强度?

2个回答

将皮尔逊相关系数(通常称为相关系数)与这些变量一起使用并没有错。我还要看看斯皮尔曼的等级相关系数。它对极端值不太敏感。

http://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient

然而,这两个系数都有一个缺点,即它们只能测量线性关系。因此,看看变量的散点图是值得的。为图表添加更平滑的效果也很有价值,尤其是在情节混乱并且您难以用肉眼发现关系的情况下。

使用事件作为行标签,时间作为列标签,活动作为数据透视表中的值。如果您在 R 中执行此操作,请使用 library(reshape)。使用熔化和铸造功能,我猜你可以解决你的问题。如果您需要任何进一步的说明,请告诉我。