“大多数男人比大多数女人快”可能有点模棱两可,但我通常会解释它的意图是如果我们看随机配对,大多数时候男人会更快 - 即P(Mi<Fj)>12对于随机i,j(在哪里Mi是时候了i-男性'等)。
当然,该短语的其他解释是可能的(毕竟这就是歧义),并且其中一些其他可能性可能与您的推理一致。
[我们还有一个问题是我们是在谈论样本还是人口......“大多数男性 [...] 大多数女性”似乎是一个人口陈述(关于潜在时代的人口),但我们只观察到时代我们似乎将其视为一个样本,因此我们必须小心我们提出的声明范围有多广。]
注意P(Mi<Fj)>12不暗示M˜<F˜. 他们可以朝相反的方向前进。
[我并不是说你认为男人比女人快的随机 MF 对的比例超过 1/2 是错误的——你几乎可以肯定是正确的。我只是说你不能通过比较中位数来判断它。您也无法通过查看每个样本中高于或低于另一个样本中位数的比例来判断它。您必须进行不同的比较。]
也就是说,虽然中位男性可能比中位女性快,但有可能有一个时间样本(或时间的连续分布,就此而言),其中随机男性比随机女性快的机会是小于_12. 在大样本中,两个相反的迹象都可能很重要。
例子:
数据集A:
1.58 2.10 16.64 17.34 18.74 19.90 1.53 2.78 16.48 17.53 18.57 19.05
1.64 2.01 16.79 17.10 18.14 19.70 1.25 2.73 16.19 17.76 18.82 19.08
1.42 2.56 16.73 17.01 18.86 19.98
数据集 B:
3.35 4.62 5.03 20.97 21.25 22.92 3.12 4.83 5.29 20.82 21.64 22.06
3.39 4.67 5.34 20.52 21.10 22.29 3.38 4.96 5.70 20.45 21.67 22.89
3.44 4.13 6.00 20.85 21.82 22.05
数据集 C:
6.63 7.92 8.15 9.97 23.34 24.70 6.40 7.54 8.24 9.37 23.33 24.26
6.18 7.74 8.63 9.62 23.07 24.80 6.54 7.37 8.37 9.09 23.22 24.16
6.57 7.58 8.81 9.08 23.43 24.45
(数据在这里,但在那里被用于不同的目的——据我回忆,我自己生成了这个)
注意A<B的比例是2/3,A<C的比例是5/9,B<C的比例是2/3。A vs B 和 B vs C 在 5% 的水平上都是显着的,但我们可以通过添加足够的样本副本来实现任何水平的显着性。我们甚至可以通过复制样本但添加足够小的抖动(足够小于点之间的最小间隙)来避免平局
样本中位数走向另一个方向:中位数(A)>中位数(B)>中位数(C)
同样,我们可以通过重复样本来实现一些中位数比较的显着性 - 到任何显着性水平。

将其与当前问题联系起来,假设 A 是“女性时代”,B 是“男性时代”。那么中位男性的时间会更快,但随机选择的男性会比随机选择的女性慢 2/3 的时间。
从样本 A 和 C 中获取线索,我们可以生成更大的数据集(在 R 中),如下所示:
n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))
F 的中位数将在 16.25 左右,而 M 的中位数将在 11.25 左右,但 F < M 的案例比例将是 5/9。
[如果我们用带参数的二项式变量替换 n/3n和13
我们将从 F 分布的中位数为 16.25 而 M 的分布中位数为 11.25 的总体中抽样。同时,在该总体中,F < M 的概率将再次为 5/9。]
另请注意P(F<med(M))=23和P(M>med(F))=23尽管med(M)<med(F)(相当远的距离)。