折刀和遗漏交叉验证之间真的有什么区别吗?程序似乎相同,我错过了什么吗?
折刀与 LOOCV
机器算法验证
交叉验证
折刀
2022-02-13 19:33:39
2个回答
Jackknife 通常指的是 2 个相关但不同的过程,这两个过程都依赖于一种留一法——导致这种非常混乱。
在一种情况下,折刀可用于估计总体参数及其标准误差。例如,要使用折刀法来估计简单回归模型的斜率和截距,可以:
- 使用所有可用数据估计斜率和截距。
- 省略 1 个观察值并估计斜率和截距(也称为系数的“部分估计”)。
- 计算斜率和截距的“部分估计”和“所有数据”估计之间的差异(也称为系数的“伪值”)。
- 对整个数据集重复步骤 2 和 3。
- 计算每个系数的伪值的平均值——这些是斜率和截距的折刀估计
系数的伪值和折刀估计也可用于确定标准误差,从而确定置信区间。通常,这种方法会为系数提供更宽的置信区间,因为它是一种更好、更保守的不确定性度量。此外,这种方法也可用于获得系数偏差的折刀估计。
在另一种情况下,折刀用于评估模型性能。在这种情况下,jackknife = leave-one-out 交叉验证。两者都是指在校准数据集中留下一个观测值,重新校准模型,并预测被遗漏的观测值。本质上,每个观察都是使用其对预测变量的“部分估计”来预测的。
这是我在网上找到的关于折刀的一篇不错的小文章: https ://www.utdallas.edu/~herve/abdi-Jackknife2010-pretty.pdf
在交叉验证中,您计算遗漏样本的统计数据。大多数情况下,您通过建立在保留样本上的模型来预测遗漏的样本。在jackknifing 中,您仅从保留的样本中计算统计量。
其它你可能感兴趣的问题