我对古科学中使用的特定类型模型拟合的不同方法进行了基于计算机的评估。我有一个很大的训练集,所以我随机(分层随机抽样)留出了一个测试集。我为训练集样本拟合个不同的方法,并使用个结果模型预测了测试集样本的响应,并计算了测试集中样本的 RMSEP。这是单次运行。
然后我多次重复这个过程,每次我通过随机抽样一个新的测试集来选择不同的训练集。
完成此操作后,我想调查这种方法中是否有任何一种方法具有更好或更差的 RMSEP 性能。我也想对成对方法进行多重比较。
我的方法是拟合线性混合效应 (LME) 模型,其中Run具有单个随机效应。我使用lmer()
lme4包中的模型和multcomp包中的函数来执行多重比较。我的模型本质上是
lmer(RMSEP ~ method + (1 | Run), data = FOO)
其中method
是指示使用哪种方法为测试集生成模型预测的因素,并且是我的“实验”Run
的每个特定运行的指标。
我的问题是关于 LME 的残差。鉴于运行的单一随机效应,我假设该运行的 RMSEP 值在一定程度上相关,但在运行之间不相关,基于随机效应提供的诱导相关性。
这种运行之间独立性的假设是否有效?如果没有,有没有办法在 LME 模型中解释这一点,还是我应该寻求采用另一种类型的静态分析来回答我的问题?