为什么我们需要引导程序?

机器算法验证 自习 估计 引导程序 标准错误
2022-01-26 01:39:53

我目前正在阅读 Larry Wasserman 的“所有统计数据”,并对他在该章中关于估计非参数模型的统计函数所写的内容感到困惑。

他写了

“有时我们可以通过一些计算找到统计函数的估计标准误差。但在其他情况下,如何估计标准误差并不明显”。

我想指出,在下一章中,他谈到了引导程序来解决这个问题,但由于我并不真正理解这句话,我并没有完全理解引导程序背后的动机?

当如何估计标准误差不明显时,有什么例子?

到目前为止,我看到的所有示例都是“显而易见的”,例如然后X1,...Xn Ber(p)se^(p^n)=p^(1p^)/n

3个回答

两个答案。

  1. 两个均值之比的标准误是多少?中位数的标准误是多少?任何复杂统计数据的标准误是多少?也许有一个封闭形式的方程,但可能还没有人解决它。
  2. 为了使用(比如说)平均值的标准误差公式,我们必须做出一些假设。如果违反了这些假设,我们不一定可以使用该方法。正如@Whuber 在评论中指出的那样,自举允许我们放宽其中的一些假设,因此可能会提供更合适的标准错误(尽管它也可能会做出额外的假设)。

一个例子可能有助于说明。假设,在因果建模框架中,您有兴趣确定(感兴趣的曝光)和(感兴趣的结果)之间的关系是否由变量调节。这意味着在两个回归模型中:XYW

E[Y|X]=β0+β1XE[Y|X,W]=γ0+γ1X+γ2W

效果与效果不同。β1γ1

例如,考虑吸烟与心血管 (CV) 风险之间的关系。吸烟会导致静脉变脆和钙化,从而明显增加心血管风险(对于心脏病发作和中风等事件)。然而,吸烟也是一种食欲抑制剂。因此,我们很好奇吸烟与心血管风险之间的估计关系是否由 BMI 介导,而 BMI 是心血管风险的独立风险因素。这里可以是逻辑回归模型中的二元事件(心肌或神经梗塞)或连续变量,如冠状动脉钙化 (CAC)、左心室射血分数 (LVEF) 或左心室质量 (LVM)。Y

我们将拟合两个模型 1:调整吸烟和结果以及其他混杂因素,如年龄、性别、收入和心脏病家族史,然后 2:所有先前的协变量以及体重指数。模型 1 和 2 之间吸烟效果的差异是我们推断的基础。

我们有兴趣测试假设

H:β1=γ1K:β1γ1

一种可能的效应测量可以是:或任意数量的测量。使用常用的估计器这些估计器的标准误差推导起来非常复杂。然而,引导它们的分布是一种常用的技术,很容易直接从中计算值。T=β1γ1S=β1/γ1TSp

为每个统计度量提供参数解决方案是可取的,但同时也非常不切实际。Bootstrap 在这些情况下会派上用场。我想到的例子涉及两种高度倾斜的成本分配方式之间的差异。在这种情况下,经典的双样本 t 检验无法满足其理论要求(由于其长右尾,所调查样本的分布肯定偏离正态性)并且非参数检验无法传达对决策者(通常对排名不感兴趣)有用的信息。避免在该问题上停滞不前的一个可能解决方案是两个样本的引导 t 检验。