估计均值差异的不同引导程序的含义

机器算法验证 置信区间 p 值 引导程序 群体差异 重采样
2022-04-13 15:36:57

我无法理解两个引导程序之间的差异,以评估两个样本之间的均值差异。例如,考虑以下场景:

我的目标是比较两国之间的幸福感,Nepal并且Bhutan我收集了一个样本N来自不丹和N尼泊尔的幸福指数。每个数据点都是 IID。

程序 1:在保留国家成员资格的同时进行引导

按照本指南(第 4-5 页),程序如下:

  1. 拟合回归模型Y=β0+β1X1使用观察到的样本来估计观察到的差异β1
  2. 将来自尼泊尔和不丹的公民汇集到一个总体人口中,保持他们的国家成员身份
  3. 用替换绘制2N来自组合总体的样本,并将回归模型拟合到这个自举样本
  4. 重复步骤 2B生成分布的时间β1价值观
  5. 使用自举分布计算 p 值和置信区间β1

程序 2:从没有国家成员资格的总体样本中抽取

在我参加的先前概率课程中的这些讲义(幻灯片 28-32)之后,程序是:

  1. 计算观察到的均值差异
  2. 将来自两国的所有公民集中到一个群体中,忽略国家成员资格
  3. 用替换绘制 NNepal自举的尼泊尔群体的总人口中的公民
  4. 用替换绘制NBhutan自举的不丹群体的总人口中的公民
  5. 计算自举的尼泊尔和不丹群体之间的均值差异
  6. 重复步骤 3-5B
  7. 使用差异的自举分布计算 p 值和置信区间

可以在程序 2 中更改国家成员资格,以便在引导样本中来自不丹的一些幸福评级似乎来自尼泊尔。这在程序 1 中从未发生过,在该程序中,尼泊尔的所有幸福评级都只归因于尼泊尔。

在程序 2 中“交换”国家成员资格有何影响?从这两个程序计算的置信区间和 p 值是否代表相同的数量?我应该期望这两个过程的结果相同吗?

0个回答
没有发现任何回复~