我将从歧视案件的经验中对它进行反向工程。我可以肯定地地方建立的价值“一741” 等,是从哪里来的。但是,翻译中丢失了太多信息,以至于我的其余重建工作都依赖于了解人们在法庭环境中如何进行统计。我只能猜测一些细节。
自从1960年代通过反歧视法(第六章)以来,美国法院已经学会了研究p值并将其与和0.01的阈值进行比较。他们还学会了查看标准化效果(通常称为“标准偏差”),并将其与“两到三个标准偏差”的阈值进行比较。为了确定歧视诉讼的表面证据,原告通常尝试进行统计计算,以显示超出这些阈值的“不同影响”。如果不能支持这种计算,那么案件通常就无法进行。0.050.01
原告的统计专家经常尝试用这些熟悉的术语表述其结果。某些专家进行了统计检验,其中零假设假设“没有不利影响”,假设雇佣决定纯粹是随机的,并且不受雇员的任何其他特征的影响。(它是一尾还是二尾的选择,可能取决于专家和情况。)然后,他们通过将该检验的p值称为标准正态分布,将其p值转换为多个“标准差”, - 即使标准的“正常”与原始测试无关。 他们希望通过这种回旋方式将结论清楚地传达给法官。
可以在列联表中汇总的数据的首选测试是Fisher精确测试。以“确切”的名义出现对于原告来说尤其令人愉悦,因为它表示已作出无误的统计确定(无论可能是!)。
那么,这就是我对劳工部计算的(推测性重建)。
他们跑费希尔精确检验,或类似的东西(如测试通过随机确定的p值)。该测试假设超几何分布,如Matthew Gunn的答案所述。(对于涉及此投诉的少数人,超几何分布不能很好地通过正态分布来近似。)χ2
他们将其p值转换为正常的Z分数(“标准差数”)。
他们将Z分数四舍五入为最接近的整数:“超过三个标准偏差”,“超过五个标准偏差”和“超过六个标准偏差”。(因为一些Z-分数四舍五入的最高更标准偏差,我不能证明“超过”;我所能做的就是引用它。)
在投诉中,这些积分Z分数被转换回p值!再次使用标准正态分布。
这些p值被描述为“根据偶然性出现此结果的可能性”(可能以一种误导的方式)。
1/12801/5650001/5800000073011601307301160130−3.16−4.64−5.521/7411/35000001/1000000000
这是R
用于执行这些计算的一些代码。
f <- function(total, percent.asian, hired.asian, hired.non.asian) {
asian <- round(percent.asian/100 * total)
non.asian <- total-asian
x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
nrow = 2,
dimnames=list(Race=c("Asian", "non-Asian"),
Status=c("Not hired", "Hired")))
s <- fisher.test(x)
s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))