非线性预测变量之间的相互作用

机器算法验证 r 混合模式 相互作用 样条 广义加法模型
2022-04-04 23:56:26

我有 70,000 名学生的数据,分布在 120 所学校。我从学校的固定效果开始,但在某些时候我可能会开始让截距和斜率变化。

一些关键预测因素(例如 gpa、考试成绩)与一些结果具有非线性关系。我绝对想将这些预测变量与分类变量进行交互,也可能与连续变量进行交互。自然三次样条可能是正确的方法,但我还没有看到任何有关交互或嵌套数据的示例,所以我可以使用一些指针。这些非线性关系并不是我研究的唯一重点,所以我不想专注于它们而忽略模型的其他方面。

我会感谢 R 包的建议、相关工作的示例以及有关如何处理此问题的一般建议。谢谢!

1个回答

您可以尝试在gamm4中轻松实现的广义加法混合模型。我使用它们的方式,您可以执行以下操作:

fit1 = gamm4(
    formula = V1 ~ V2 + s(V3)
    , random = ~ (1|V4)
)
fit2 = gamm4(
    formula = V1 ~ V2 + s(V3,by=V2)
    , random = ~ (1|V4)
)

fit1试图使用 V4 作为随机效应和 V2 和 V3 作为固定效应来预测 V1,但其中 V3 是样条平滑的。fit2寻求相同,除了允许 V3 的平滑度在 V2 的级别内变化,从而实现交互。比较fit1tofit2评估允许交互的必要性。