插入符号重采样方法

机器算法验证 r 重采样 插入符号
2022-01-23 20:05:35

我正在使用caretR 中的库来测试各种建模过程。

trainControl对象允许指定一种重新采样方法。这些方法在文档第 2.3 节中进行了描述,包括bootboot632cvLOOCV尽管其中一些很容易推断,但并非所有这些方法都被明确定义。LGOCVrepeatedcvoob

这些重采样方法对应的程序是什么?

2个回答

好的,这是我的尝试:

  • 引导 - 引导
  • boot632 -- 0.632 引导程序
  • cv - 交叉验证,大概是指K-fold cross-validation
  • LOOCV——留一法交叉验证,也称为刀锋。
  • LGOCV - 离开组交叉验证,LOOCV 的变体,用于分层数据。
  • repeatcv - 可能是重复的随机子抽样验证,即以随机方式完成训练和测试数据的划分。
  • oob - 指Breiman 提出的袋外估计,进一步与bootstrap 聚合有关。(链接里的文件不是ps文件,而是ps.Z文件,重命名再打开试试。)

根据repeatedcvMax Kuhn 的介绍,肯定会重复 10 倍交叉验证。默认的重采样方案是引导程序。

您可以查看重采样方法的一个好文件是Predictive Modeling with R and the caret Package ( pdf )。Max 在“user!2013”​​中介绍了这个。