线性回归中的斜率可以用作其他回归模型中的自变量或因变量吗?

机器算法验证 回归 混合模式 重复测量 面板数据
2022-03-21 08:21:15

我有 100 名患者,每位患者进行 10 次纵向血清肌酐测量。估计的肾小球滤过率 (eGFR) 由包含性别、年龄和血清肌酐的 MDRD 公式计算得出。eGFR 是因变量,时间是每位患者线性回归中的自变量。

  1. 线性回归是否违反了“独立 X”假设而应该使用线性混合模型?
  2. 是否可以使用从每个患者(在每个患者的线性回归或随机效应混合模型中[如何在混合模型中估计每个患者的斜率?])估计的 eGFR 斜率(这是具有不确定性而不是测量数字的估计值)作为其他回归模型中的自变量还是因变量?

谢谢你。

1个回答

实际上,您建议使用线性回归作为一种数学程序,将 10 变量的观察值浓缩为单个变量(斜率)。因此,这只是类似程序的另一个示例,例如(例如)使用重复测量的平均值作为回归变量或在回归中包括主成分分数。

具体意见如下。

(1) 线性回归不要求 X(自变量)是“独立的”。事实上,在标准公式中,独立性的概念甚至不适用,因为 X 是固定值,而不是随机变量的实现。

(2) 是的,您可以使用斜率作为变量。这将有助于确定它们可能表现得像线性回归中的因变量。对于普通最小二乘法,这意味着

一个。斜率可能取决于某些患者属性。

湾。至少对于观察到的患者属性范围,这种依赖性近似线性。

C。观察到的斜率和假设的斜率之间的任何变化都可以被认为是随机的。

d。这种随机变化 (i) 与患者无关,并且 (ii) 在患者与患者之间具有大致相同的分布。

e. 和以前一样,自变量不被视为随机变量,而是固定和测量的,没有明显的误差。

如果所有这些条件都大致成立,你应该没问题。(d)或(e)的违反可以通过使用普通最小二乘的推广来解决。

(2')。因为斜率会表现出不确定性(在用于估计斜率的回归中测量),它们可能不是独立变量的良好候选者,除非您在混合模型中将它们视为随机变量或使用变量误差模型。

您还可以通过分层贝叶斯模型来应对这种情况