我将从歧视案件的经验中对此进行逆向工程。我绝对可以确定“741 中的一个”等值的来源。然而,在翻译过程中丢失了太多信息,以至于我的其余重建依赖于看到人们如何在法庭环境中进行统计。我只能猜测一些细节。
自 1960 年代通过反歧视法(标题 VI)以来,美国的法院已经学会了查看 p 值并将它们与和的阈值进行比较。他们还学会了查看标准化效应,通常称为“标准差”,并将它们与“两到三个标准差”的阈值进行比较。为了确立歧视诉讼的表面证据,原告通常会尝试进行统计计算,显示超过这些阈值的“不同影响”。如果不能支持这样的计算,案件通常无法推进。0.050.01
原告的统计专家经常试图用这些熟悉的术语来表达他们的结果。一些专家进行了一项统计检验,其中零假设表示“没有不利影响”,假设雇佣决定纯粹是随机的,不受员工任何其他特征的影响。(它是单尾还是双尾替代方案可能取决于专家和情况。)然后他们将此测试的 p 值转换为许多“标准偏差”,方法是将其引用到标准正态分布 - -即使标准 Normal 与原始测试无关。 他们希望通过这种迂回的方式将自己的结论清楚地传达给法官。
可以在列联表中总结的数据的首选检验是 Fisher 精确检验。在其名称中出现“Exact”特别令原告满意,因为它意味着已做出无错误的统计确定(无论可能是什么!)。
那么,这就是我对劳工部计算的(推测性重建)。
他们运行了 Fisher 精确检验或类似的方法(例如通过随机化确定 p 值该测试假设 Matthew Gunn 的回答中描述的超几何分布。(对于涉及此投诉的少数人,超几何分布不能很好地近似为正态分布。)χ2
他们将其 p 值转换为正常的 Z 分数(“标准偏差数”)。
他们将 Z 分数四舍五入到最接近的整数:“超过三个标准偏差”、“超过五个标准偏差”和“超过六个标准偏差”。(因为这些 Z 分数中的一些四舍五入到更多的标准偏差,我不能证明“超过”是合理的;我所能做的就是引用它。)
在投诉中,这些积分 Z 分数被转换回 p 值!再次使用标准正态分布。
这些 p 值被描述为(可以说是以一种误导的方式)“这个结果是偶然发生的可能性”。
为了支持这一推测,请注意三个实例中 Fisher 精确检验的 p 值大约为、和。这些基于假设池、和分别对应于“超过”、和。这些数字的正常 Z 分数为1/12801/5650001/5800000073011601307301160130−3.16,−4.64, 和−5.52,四舍五入时分别是三个、五个和六个标准差,正是投诉中出现的数字。它们对应于(单尾)正态 p 值1/741,1/3500000, 和1/1000000000:正是投诉中引用的价值观。
这是一些R
用于执行这些计算的代码。
f <- function(total, percent.asian, hired.asian, hired.non.asian) {
asian <- round(percent.asian/100 * total)
non.asian <- total-asian
x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
nrow = 2,
dimnames=list(Race=c("Asian", "non-Asian"),
Status=c("Not hired", "Hired")))
s <- fisher.test(x)
s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))