我经常发现自己在 R 中训练了几个不同的预测模型caret
。我将在相同的交叉验证折叠上训练它们,使用caret::: createFolds
,然后根据交叉验证的错误选择最佳模型。
但是,来自多个模型的中值预测通常优于独立测试集上的最佳单个模型。我正在考虑编写一些函数来堆叠/集成插入符号模型,这些模型使用相同的交叉验证折叠进行训练,例如通过从每个模型的每个折叠中获取中值预测,或者通过训练“元模型”。
当然,这可能需要一个外部交叉验证循环。有谁知道用于集成插入符号模型(并可能交叉验证这些集成)的任何现有包/开源代码?