差异 Bagging 和 Bootstrap 聚合

数据挖掘 聚合 自举 装袋
2022-02-24 21:46:16

Bootstrap 属于 Efron。Tibshirani 写了一本关于 Efron 的书。 .

用于估计统计量 s(x) 的标准误差的引导过程。B bootstrap 样本是从原始数据生成的。最后,值 s(x1),s(x2)..s(xB) 的标准偏差是我们对 s(x) 标准误差的估计。标准误差的引导估计是引导复制的标准偏差。B 的典型值,bootstrap 样本的数量范围从 50 到 200 用于标准误差估计

Breiman 在 1996 年的论文中写道, 在此处输入图像描述

我的理解是,只有当它是:

  • 复制和随机

这就是所谓的装袋。这是否意味着,当你只是/只在最后没有聚合的情况下进行引导时,你只使用引导复制的标准偏差,而不是你称之为引导。

如果你做同样的事情,但最后你采取了投票或其他任何事情的聚合,而不是你称之为装袋。

我对吗?

所以Breiman最后没有给出聚合方法的确切答案。但他的方法(投票)与 Tibshiranis 书中引用 Efron 的原始方法(Efron 的方法)中的原始引导方法(标准差)不同。

我们可以说这是 bagging 和 bootstrap 聚合的不同吗?当然粗略的说是一样的。(但我正在寻找正确的答案)。

0个回答
没有发现任何回复~