类似以下的报告和网页提示了这个问题:Kurt Bauman 和 Camille Ryan 于 2015 年 10 月 7 日,美国人口普查博客Random Samplings撰写的“现在是班级的负责人,领导男性大学成就的女性” 。(这不是家庭作业。)
根据美国劳工统计局当前人口调查的 2017 年年度数据,以及 25 岁及以上的美国平民劳动力:
性别与拥有学士学位或更高学位之间是否存在实际或统计意义或两者之间的关系?为什么或者为什么不?
这两个变量——性别和拥有学士学位或更高学位——在 BLS 估计中都是自然二分变量。一个人要么是男人要么是女人,要么拥有学士学位或更高学位,要么没有。
下面的表 1 包含双向 2×2 列联频率分布表 中的 BLS 估计值1 ,其中包含用于显示相关数字的额外行和额外列。(下面最后一个编号的注释包含此问题的 CSV 格式的表格数据,以便您更轻松地将其加载到电子表格或其他程序中。)
可以看出,39.69991%的总人口拥有本科及以上学历,但男性拥有本科及以上学历的比例低于该比例,女性拥有本科及以上学历的比例高于该比例。因此,可以通过获得学士学位的女性的百分比或比率与可以通过该测试的男性的百分比或比率之间存在差异。
Table 1: Numbers from and derived from 2017 B.L.S. C.P.S.
|Civilian |Bachelor's | | Expected | Difference |
| labor force | degree | % | number at | from |
| age >= 25 | or higher | (rate) | 39.69991% | expected |
---------|-------------|-----------|----------|-----------|------------|
Men | 74,258,000| 27,781,000| 37.41146%| 29,480,360| -1,699,360|
---------|-------------|-----------|----------|-----------|------------|
Women | 64,901,000| 27,465,000| 42.31830%| 25,765,639| +1,699,360|
---------|-------------|-----------|----------|-----------|------------|
Together | 139,159,000| 55,246,000| 39.69991%| [n/a] | [n/a] |
---------|-------------|-----------|----------|-----------|------------|
Disparity| [n/a] | [n/a] | 88.40492%| [n/a] | [n/a] |
in rates | | | | | |
---------|-------------|-----------|----------|-----------|------------|
如表 1 所示,按性别划分的比率差异为 88.40492%。每 100 名拥有此类学位的女性中,大约有 88 名拥有学位的男性。总差距为3,398,720。
可以将表 1 的估计值输入许多在线卡方计算器之一以获得结果p-value<.00001。
然而,同样,那些 BLS 估计只是:估计。通过检查 BLS 对实际数字有一定程度的置信度的范围,可以进一步了解明显的差异。BLS 提供了有关如何确定估计值的 95% 置信区间水平的说明。2 在 95% 的置信水平下,低端和高端数字如下:
Table 2: B.L.S. low and high end numbers with 95% level of confidence intervals.
|Civilian |Civilian |Bachelor's |Bachelor's |
| labor force | labor force | degree | degree |
| age >= 25 | age >= 25 | or higher | or higher |
| LOW END | HIGH END | LOW END | HIGH END |
---------|-------------|-------------|-----------|-----------|
Men | 73,635,096| 74,880,904| 27,172,805| 28,389,195|
---------|-------------|-------------|-----------|-----------|
Women | 64,285,841| 65,516,159| 26,857,979| 28,072,021|
---------|-------------|-------------|-----------|-----------|
获得学士学位或更高学位的性别比例差异可以通过使用以下极端案例数字来缩小和缩小:对于男性,使用低端劳动力数量和高端学士学位或更高学位数字。对于女性,则相反:使用高端劳动力数量和低端本科或更高学历数量。这些数字可以列表如下:
Table 3: Table 1 but starting with edge-case least-disparate numbers based on the 95% level of confidence intervals.
|Civilian |Bachelor's | | Expected | Difference |
| labor force | degree | % | number at | from |
| age >= 25 | or higher | (rate) | 39.70296% | expected |
---------|-------------|-----------|----------|-----------|------------|
Men | 73,635,096| 28,389,195| 38.55389%| 29,235,316| -846,121|
---------|-------------|-----------|----------|-----------|------------|
Women | 65,516,159| 26,857,979| 40.99443%| 26,011,858| +846,121|
---------|-------------|-----------|----------|-----------|------------|
Together | 139,151,255| 55,247,174| 39.70296%| [n/a] | [n/a] |
---------|-------------|-----------|----------|-----------|------------|
Disparity| [n/a] | [n/a] | 94.04665%| [n/a] | [n/a] |
in rates | | | | | |
---------|-------------|-----------|----------|-----------|------------|
因此,在 2017 年 25 岁及以上的平民劳动力中,拥有学士学位或更高学位的性别比例的差异——当使用边缘案例最小差异案例数时——为 94.04665%。总差距为 1,696,244。
即使表 3 是基于边缘情况最小不同的数字,这些数字仍然导致结果p-value<.00001。
诸如被检查的差异之类的关系差异通常被发现在 p 值 <.05 时具有统计学意义。可以通过使用表 1 估计值和边缘情况最小差异表 3 数字确定差异需要是什么来获得 p 值 <.05,从而获得对明显差异的额外洞察。
要获得表 1 估计的 p 值 <.05,性别比例的差异必须是 99.93755% 和 17,180 的整数。(见附注中的表 4。)
要使用边缘情况最小差异表 3 数字获得 p 值 <.05,性别比例的差异必须是 99.93758% 和 17,190 的整数。(见附注中的表 5。)
换句话说,这种差异可能比将差异归因于机会所需的大约 17,190 个人多 1,696,244 到 3,398,720 个人。
笔记:
- BLS 数字基于此处和此处的 BLS 2017“当前人口调查”(“CPS”)数字(以千计) 。例如,表 1 的“平民劳动力年龄 >= 25”数字基于以下简单相加:
- 男性 = 25 至 54 岁 (54,813,000) + 55 至 64 岁 (14,156,000) + 65 岁及以上 (5,289,000) = 74,258,000
- 女性 = 25 至 54 岁 (47,870,000) + 55 至 64 岁 (12,743,000) + 65 岁及以上 (4,288,000) = 64,901,000
- 来自 BLS 经济学家 K. Kosanovich,2018-03-06~16:59EST:* * * 有关 CPS 估计的可靠性以及如何构建近似标准误和置信区间的信息,请访问https://www.bls .gov/cps/documentation.htm#reliability。* * * 有几种方法可以构建置信区间。例如,您可以计算 1 来估计 2017 年 25 岁及以上的民用劳动力中的男性人数(年平均值)。我将使用 PDF 文件中关于在线计算标准误差的指南简要回顾一个示例,网址为https://www.bls.gov/cps/documentation.htm#reliability以及该链接的 XLSX 文件中提供的参数和因素。* * * 以 2017 年为例,劳动力中有 27,781,000 名男性拥有本科及以上学历。我将在表 PF-4中选择具有学士学位的年平均人数的参数和因子,其中 a = -0.0001858,b = 12882.76,f = 0.67。计算标准误差对于年平均水平,公式为 se(x) = f * squareroot[ax2 + bx]。在这种情况下,标准误差 27,781,000 = 0.67 * squareroot [ (-0.0001858 * 27,781,000 * 27,781,000) + (12882.76 * 27,781,000) ] 或 310,304。为了创建 90% 的置信区间,我们将标准误乘以 1.645,得到 510,450 或大约正负 510。我们有 90% 的信心认为劳动力中拥有学士学位或以上学历的男性人数是27,781,000 加减约 510,000。您可以使用相同的参数和因素为拥有学士学位或更高学位的女性构建置信区间。对于 25 岁及以上劳动力中的男性或女性,您可以使用表 PF-1 中男性和女性 20 岁及以上的参数和因子。
- 评论者引用的该问题的先前版本以 Jon Marcus 的故事“为什么男人是新的大学少数群体”为特色,2017 年 8 月 8 日,大西洋。
- CSV 格式的表格如下:
表 1:2017 年 BLSCPS 的数字和派生数字,,,,, ,文职劳动力年龄>=25,本科以上学历,%(率),预期人数为39.69991%,与预期差异 男,74258000,27781000,37.41146%,29480360,-1699360 女性,64901000,27465000,42.31830%,25765640,1699360 合计,139159000,55246000,39.69991%,[n/a],[n/a] 比率差异,[n/a],[n/a],88.40492%,[n/a],[n/a] ,,,,, 表 2:基于 95% 置信区间水平的 BLS 低端和高端数字。,,,,, ,文职劳动力年龄>=25 LOW END,文职劳动力年龄>=25 HIGH END,本科以上学历 LOW END,本科以上学历 HIGH END, 男士,73635096,74880904,27172805,28389195, 女性,64285841,65516159,26857979,28072021, ,,,,, 表 3:表 1,但具有基于 95% 置信区间水平的极端情况最小差异数字。,,,,, ,文职劳动力年龄>=25,本科以上学历,%(率),预期人数为39.70296%,与预期差异 男,73635096,28389195,38.55389%,29235316,-846121 女性,65516159,26857979,40.99443%,26011858,846121 一起,139151255,55247174,39.70296%,[n/a],[n/a] 比率差异,[n/a],[n/a],94.04665%,[n/a],[n/a] ,,,,, 表 4:表 1 劳动力数字,学位数字与预期数字等距以获得 p 值<.05,,,,, ,文职劳动力年龄>=25,本科以上学历,%(率),预期人数为39.69991%,与预期差异 男性,74258000,29471770,39.68834%,29480360,-8590 女性,64901000,25774229,39.71315%,25765639,8590 一起,139159000,55245999,39.69991%,[n/a],[n/a] 比率差异,[n/a],[n/a],99.93755%,[n/a],[n/a] ,,,,, 表 5:表 3 边缘情况最小差异劳动力数字,其学位数字与预期数字等距以获得 p 值<.05,,,,, ,文职劳动力年龄>=25,本科以上学历,%(率),预期人数为39.70296%,与预期差异 男,73635096,29226721,39.69129%,29235316,-8595 女性,65516159,26020453,39.71608%,26011858,8595 一起,139151255,55247174,39.70296%,[n/a],[n/a] 比率差异,[n/a],[n/a],99.93758%,[n/a],[n/a]