我可以使用自举,为什么或为什么不?

机器算法验证 引导程序
2022-03-01 01:03:26

我目前正在使用卫星图像进行生物量估计。我将快速定义我的问题的背景,然后解释我正在研究的统计问题。

背景

问题

我正在尝试估算法国某个地区的生物量。我的回答是蒸汽木材的体积密度(以为单位),它或多或少与生物量成正比(取决于木材密度......)。m3/ha

我所拥有的自变量是从该地区测量的反射率得出的植被指数(研究中使用的卫星是 MODIS,对于那些知道它的人来说)。这些指数是例如 NDVI、EVI 等。我有指数的地图,地图的分辨率是 250m。

这些指数与同一森林类型(生物群落和气候)的体积之间存在很强的相关性。所以我试图在我知道体积的库存图上根据这些指标(实际上是它们的时间序列)回归体积密度。

森林库存

这些图上的体积是使用以下抽样方法估算的:

  1. 库存节点放置在覆盖该区域的规则网格上。
  2. 每个节点都附有一个地块,清点过程(树类型、体积、树冠高度等)发生在该地块上。当然,我只对库存图感兴趣,我的植被指数的值是包含该图的像素的值。
  3. 地块上的盘点过程如下:

    http://i.stack.imgur.com/DeHdC.png

    • 在半径 15m 的圆内测量直径 > 37.5cm 的树木
    • 在 9m 半径圆内测量直径 > 22.5cm 的树木
    • 在 6m 半径圆内测量直径 > 7.5cm 的树木

然后使用膨胀因子计算体积密度。

对于每个地块,我都可以访问所有测量树的数据。

此外,对于每棵树,由于使用异速生长方程(假设为 10%),我对体积有不确定性。

统计数据很重要的地方...

为了使我的回归更准确,我需要为每个体积估计值提供该度量的方差/CI。IMO,这取决于采样的树木数量和发现的体积密度。

所以我有两个问题:

  1. 如何解释我的植被指数是在 250m 的像素上测量的?

    我可以假设体积密度在一个像素上是恒定的,并且我用一个库存图对这个像素进行采样。

  2. 如何估计我的体积密度的可变性?

    我想我可以在树种群上使用自举。但是我测量的树木总数可能很小(从 7 到 20 ......)。此外,我如何考虑到我根据树木的大小在不同的圆圈上测量树木的事实?如果我查看整个像素,可变性应该如何变化?

我也在想我可以使用蒙特卡洛模拟来模拟森林,然后随机抽样这片森林,并用图来看看发生了什么......

我没有很强的统计背景,所以我有点迷茫!

2个回答

我不太了解您的数据,但我可以告诉您,对罕见事件更有效的多项式引导程序的替代方法是扰动/狂野引导程序。扰动非常灵活,通常能够处理非独立同分布数据,但有时需要大量技巧才能正确逼近 cdf。如果您成功地正确指定了 bootstrap 公式,那么您将做出更少的假设,并且可能比之前建议的平滑方法的偏差更小,特别是考虑到您的稀疏数据集,这可能会使密度估计不稳定。

如果我不得不解决这个问题,我会首先开始:

  1. 查看源数据的地图
  2. 尝试在表面上进行某种 2d 平滑,尝试用 AIC 通知它
  3. 计算该位置的平滑导数,并使用 delta 方法将输入变化与输出变化联系起来
  4. 将此结果与一些“已知”值进行比较,以验证/验证该方法

相关链接: http: //www.stanford.edu/class/cme308/notes/TaylorAppDeltaMethod.pdf http://www.ingentaconnect.com/content/klu/stco/2010/00000020/00000004/00009140?crawler=true