使用引导程序,我使用两种方法计算显着性检验的 p 值:
- 在原假设下重新采样并计算结果至少与来自原始数据的结果一样极端
- 在备择假设下重新抽样,并计算结果与原始结果的距离至少与原假设对应的值一样远
我相信第一种方法是完全正确的,因为它遵循 ap 值的定义。我不太确定第二个,但它通常给出非常相似的结果并提醒我进行 Wald 测试。
我对吗?两种方法都正确吗?它们是否相同(对于大样本)?
两种方法的示例(在 DWin 的问题和 Erik 的回答之后进行编辑):
示例 1. 让我们构建一个类似于两个样本 T 检验的自举检验。方法 1 将从一个样本中重新采样(通过合并原始两个样本获得)。方法 2 将独立地从两个样本中重新采样。示例 2。让我们构建一个 x₁…xₐ 和 y₁…yₐ 之间相关性的引导测试。方法 1 将假设没有相关性,并允许重新采样 (xₑ,yₔ) 对,其中 e≠ə。方法 2 将编译原始 (x,y) 对的引导样本。
示例 3. 让我们构建一个引导测试来检查硬币是否公平。方法 1 将创建随机样本,设置 Pr(head)=Pr(tail)=½。方法 2 将重新采样实验头/尾值的样本,并将比例与 ½ 进行比较。