变量选择的一种标准错误规则

机器算法验证 交叉验证 标准错误
2022-04-10 18:34:28

Breiman 等人推荐了 1-SE 规则,并表明它可以成功地筛选出噪声变量。在页号。他们书中的 80本书,我对“1 SE 规则”感到困惑。

R[T(kl)]R[T(k0)]+S.E{R[T(k0)]}

其中是树的序列数(变量数),对应的 K 折交叉验证预测误差估计为 那么,选择的树是,其中是满足上述方程的最大请注意T1,T2,...R[T1],R[T2],...T(kl)klkR[T(k0)]=minkR[Tk]

我的问题是我将如何计算因为它只是一个值,请在我错的地方纠正我。S.E{R[T(k0)]}

1个回答

它不是像使用每个交叉验证折叠作为“独立”测量 (对于给定的 i)的平均值误差一样简单吗?(即计算的标准偏差(跨K折),然后除以给出了该标准误差的合理的基于重采样的代理)R[Ti]R[Ti]K1