使用样条或分数多项式时如何处理缺失数据?

机器算法验证 回归 缺失数据 分数多项式
2022-03-29 10:58:16

我正在阅读多变量模型构建: Patrick Royston 和 Willie Sauerbrei 的基于分数多项式对连续变量建模的回归分析的实用方法。到目前为止,我印象深刻,这是一种我以前没有考虑过的有趣方法。

但作者不处理缺失的数据。确实,在第 4 页。17 他们说缺失数据“带来了许多额外的问题。这里没有考虑。”

多重插补是否适用于分数多项式>

FP 在某些方面(但不是全部)是样条曲线的替代方案。样条回归处理缺失数据是否更容易?

1个回答

多重插补可以与分数多项式和样条一起使用。让我们这么说f(x)代表您的功能形式(例如,f(x)=x+x.5)。fm()是在每个中估计的函数M合成样本,那么你的功能是1MmMfm(x).

假设您使用的软件可以为 x 的每个唯一值提供标准误差估计,您可以使用 Rubin 的(调查中不答复的多重插补;1987 年)公式来计算标准误差。多重插补的自由度有小样本和大样本公式。大样本公式(也在 Rubin 中)只采用与标准误差相同的输入,因此也可以使用。小样例以模型的自由度为输入;这个公式是否可以在这里应用对我来说并不明显。