P(M一世< FĴ)> 12我,Ĵ中号一世一世
当然,对该短语的其他解释也是可能的(毕竟这就是歧义),而其他一些可能性可能与您的推理相符。
[我们还有一个问题,我们是在谈论样本还是人口。...“大多数男人[...]大多数女人”似乎是一个人口声明(大约是潜在时间的人口),但是我们只观察了时间我们似乎将其视为一个样本,因此我们在提出索赔的范围上必须谨慎。]
P(M一世< FĴ)> 12中号〜< F〜
[我不是说你错在以为随机MF对其中的人比女人更快的比例超过1/2 -你几乎肯定是正确的。我只是说您无法通过比较中位数来说明这一点。您也无法通过查看每个样本中另一个样本中位数以上或以下的比例来说明这一点。您必须进行其他比较。]
1个2
例:
数据集A:
1.58 2.10 16.64 17.34 18.74 19.90 1.53 2.78 16.48 17.53 18.57 19.05
1.64 2.01 16.79 17.10 18.14 19.70 1.25 2.73 16.19 17.76 18.82 19.08
1.42 2.56 16.73 17.01 18.86 19.98
数据集B:
3.35 4.62 5.03 20.97 21.25 22.92 3.12 4.83 5.29 20.82 21.64 22.06
3.39 4.67 5.34 20.52 21.10 22.29 3.38 4.96 5.70 20.45 21.67 22.89
3.44 4.13 6.00 20.85 21.82 22.05
数据集C:
6.63 7.92 8.15 9.97 23.34 24.70 6.40 7.54 8.24 9.37 23.33 24.26
6.18 7.74 8.63 9.62 23.07 24.80 6.54 7.37 8.37 9.09 23.22 24.16
6.57 7.58 8.81 9.08 23.43 24.45
(数据在这里,但是在那里被用于其他目的-回忆起我自己生成了这个)
请注意,A <B的比例为2/3,A <C的比例为5/9,B <C的比例为2/3。A对B和B对C的显着性水平均为5%,但只要添加足够数量的样本,我们就可以达到任何显着性水平。我们甚至可以通过复制样本但添加足够小的抖动(足够小于点之间的最小间隙)来避免联系。
样本中位数朝另一个方向:中位数(A)>中位数(B)>中位数(C)
同样,通过重复样本,我们可以对中位数进行比较(达到任何显着性水平),从而获得显着性。
为了将其与当前问题联系起来,假设A是“女性时代”,B是“男性时代”。那么男人的中位数时间会更快,但是随机选择的男人会比随机选择的女人慢2/3的时间。
从样本A和C中得到线索,我们可以生成更大的数据集(在R中),如下所示:
n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))
F的中位数约为16.25,而M的中位数约为11.25,但F <M的情况的比例为5/9。
[如果我们将n / 3替换为参数的二项式变量ñ1个3
P(F< 配有(中号))= 23P(M> 配有(˚F))= 23配有(中号)< 配有(˚F)