泊松回归合适吗?

机器算法验证 回归 造型 泊松回归
2022-03-29 07:55:57

我决定使用泊松回归来分析体重增加,并想就它是否合适获得第二意见。

在基线测量体重,几个月后获取第二个值,但月数和观察时间差异很大。所以我认为使用阈值权重增加来定义什么是事件,计算每个受试者的人时并使用泊松回归来比较组(要包含在模型中的分组变量)是合适的。每个受试者仅使用一次观察结果(基线除外),结果将为 0 或 1,具体取决于受试者是否超过体重增加阈值。

*首先,泊松回归在这种情况下是否合适?

*泊松回归可以处理多个协变量和它们之间的交互吗?

*少数受试者有更多的体重测量值(但大多数人没有),这是一个问题吗?

1个回答

泊松回归似乎不适用于您的情况。

首先,泊松回归模型很重要,而且你的事件是二元的,所以如果有的话,逻辑回归会更合适。(泊松回归用于对罕见的二元事件进行建模,但我假设您的数据中有如此多的 1,以至于泊松回归也会预期有多个 2 和几个 3,并且它们的缺失将使模型比逻辑回归。)

此外,对于这里和其他地方的许多线程来说,对数据进行二分法是不好的做法。如果您的阈值是体重增加 3 磅,那么您会将两个体重增加 3 磅和 20 磅的受试者视为完全相同(两者的结果均为 1),以及一个体重增加 2 磅和 1 磅的受试者减掉 10 磅(两者都是 0) - 不用说,这非常(并且人为地)丢掉了很多数据。

我更愿意推荐 ANOVA 风格的分析,它可以处理连续的结果变量。在您的情况下,由于您正在处理重复测量(您应该模拟受试者的体重测量是相关的事实),重复测量方差分析(也称为“混合模型”)将是合适的。您甚至可以指定相隔两个月进行的两次测量将比相隔四个月进行的两次测量具有更高的相关性(例如,corCAR在 R 中使用误差相关性,在 SAS 中以类似的方式)。

重复测量 ANOVA 可以处理预测变量和交互作用(通常称为“ANCOVA”)。它可以处理对不同主题的不同数量的测量。如果您坚持对数据进行二分法,您甚至可以运行重复测量逻辑回归。