机器算法验证 - 不确定 p 值的标准误差在 Fisher 精确检验中是否有意义 - 吾爱随笔录

我正在对一些失业和工资数据实施 Fisher 精确检验。这个想法是通过汇总统计来描述两个人群（一个接受援助计划（“治疗”）和一个没有接受它）。

我使用的第一个统计数据是两个人群治疗后平均工资水平的差异。

为了计算这种设置的 p 值，我们的想法是对分配向量进行大量随机排列（0 和 1 的列表，指示给定的观察值是否属于控制群体） . 我计算每个随机分配的汇总统计量，以获得对照组不同的反事实实验中汇总统计量的分布。 $N$

由于我还具有观察到的分配向量的汇总统计量（真正观察到的实验的 0 和 1 的实际向量），因此我可以计算比观察到的汇总统计量更极端的模拟汇总统计量的数量。

我所有模拟试验中的这个比例用作我的汇总统计的估计 p 值。

我的问题如下：有没有一种标准方法可以得到这样一个估计的 p 值的标准误差？显然，我可以在我的模拟中计算汇总统计数据的蒙特卡洛标准误差，但由于所有模拟都只用于一个单一的 p 值计算，因此不清楚如何获得标准误差。

对于这种情况下的标准错误，我有以下想法。

在通常的 Monte Carlo 中，我们有一些函数，我们在每次模拟绘制时计算它（这里，被理解为分配向量）。如果我定义： $f$ $x_{i}$ $x_{i}$

f (x_{i}) = 1_{| s t a t (x_{i}) | > | s t a t (x_{o b s}) |}

$f(x_{i}) = \mathbb{1}_{ |stat(x_{i})| > |stat(x_{obs})| }$

那么似乎我计算的 p 值由下式给出

\hat{p} = \frac{1}{N} \sum_{i = 1}^{N} f (x_{i}) = \frac{# more extreme}{total samples}

$\hat{p} = \frac{1}{N}\sum_{i=1}^{N}f(x_{i}) = \frac{\textrm{# more extreme}}{\textrm{total samples}}$

然后按照通常的蒙特卡洛公式，将估计的方差写成：

V a r (\hat{p}) = \frac{1}{N} \sum_{i = 1}^{N} [f (x_{i}) - \hat{p}]^{2}

$Var(\hat{p}) = \frac{1}{N}\sum_{i=1}^{N}[ f(x_{i}) - \hat{p} ]^{2}$

然后取平方根得到标准误？

这让我感到困惑的原因是，对于每个，将是二进制的，计算的统计数据在该迭代中更极端，或者不是。总结一堆二进制的东西来估计p值的方差似乎很容易出错，但这可能只是我对这种方法的不熟悉。 $i$ $f(x_{i})$

任何人都可以确认这是正确的吗？此外，如果我对我在这里所做的事情有任何其他无知，我们将不胜感激。