布鲁斯的回答很棒。我想提供另一种方式来询问您观察到的结果是否合理。很容易查看 p 值并认为它与我们对观察到的数据和模型的直觉有关是“错误的”。
通过考虑我们的模型在零假设下会生成什么数据可能有助于重新构建这一点。正如 whuber 所指出的,招聘中的性别偏见是一个复杂的话题,所以我在这里指的是“正面的数量”,就像抛硬币正面朝上的数量一样。然而,原则上,只要满足适当的假设,同样的问题将适用于任何二项式模型。
首先,让我们模拟如果我们连续抛 16 个硬币,我们得到多少正面,并重复该模拟 10,000 次。结果的分布是什么,2 在那个分布上的位置是什么?
a <- replicate(10000, rbinom(1, size = 16, prob = 0.5))
hist(a,
breaks = "FD",
xlab = "Number of heads",
main = "Histogram of number of heads when n=16, p=0.5"
)
abline(v = 2, lty = "dashed")
2 存在于我们的模拟数据中,但频率非常低。因此,0.2% 似乎至少在正确的范围内。请记住,我们只进行了 10,000 次重复,所以当然会有错误。
现在,让我们模拟在模拟 1150 次翻转时我们得到的正面数量,重复该过程 10,000 次,并可视化分布以及观察到的 350 值:
b <- replicate(10000, rbinom(1, size = 1150, prob = 0.5))
hist(b,
breaks = "FD",
xlab = "Number of heads",
main = "Histogram of number of heads when n=1150, p=0.5"
)
abline(v = 350, lty = "dashed")
嗯。除非我们手动调整 x 轴,否则分布上甚至看不到 350!
## in fact 350 isn't visible unless we set xlim
hist(b, breaks = "FD",
xlab = "Number of heads", xlim = c(340, max(b) * 1.1),
main = "Histogram of number of heads when n=1150, p=0.5"
)
abline(v = 350, lty = "dashed")
和
的二项分布,是一个非常奇怪的结果!因此,极小的 p 值并不令人惊讶。我认为你需要在模拟范围内观察一个极端的值,事实上......p=0.5n=1150x=3501e40