首先: 据我了解,引导残差的工作原理如下:
- 将模型拟合到数据
- 计算残差
- 对残差重新采样并将它们加到 1。
- 将模型拟合到 3 中的新数据集。
- 重复
n
次数,但始终将重新采样的残差添加到从 1 开始的拟合中。
到目前为止是正确的吗?
我想做的是略有不同:
我想为估计一些环境变量的算法估计参数和预测不确定性。
我所拥有的是该变量 的无错误时间序列(来自模拟),x_true
我在其中添加了一些噪声 ,x_noise
以生成合成数据集x
。然后,我尝试通过将平方和sum((x_estimate - x_true)^2)
(!不是x_estimate - x
!)作为目标函数拟合我的算法来找到最佳参数。为了查看我的算法如何执行并创建参数分布的样本,我想重新采样x_noise
,将其添加到x_true
,再次拟合我的模型,冲洗并重复。这是评估参数不确定性的有效方法吗?我可以将自举数据集的拟合解释为预测不确定性,还是必须遵循我上面发布的程序?
/edit:我想我还没有真正弄清楚我的模型是做什么的。把它想象成一种去噪方法。它不是一个预测模型,它是一种算法,它试图从环境数据的嘈杂时间序列中提取潜在信号。
/edit^2:对于那里的 MATLAB 用户,我写了一些快速而肮脏的线性回归示例来说明我的意思。
这就是我认为残差的“普通”引导(如果我错了,请纠正我): http: //pastebin.com/C0CJp3d1
这就是我想做的:http: //pastebin.com/mbapsz4c