理解辛普森的悖论:安德鲁·盖尔曼(Andrew Gelman)的性别和身高收入递减示例


22

安德鲁·盖尔曼(Andrew Gelman)在他最近的一篇博客文章中说:

  1. 我认为反事实或潜在的结果对于辛普森悖论没有必要。我之所以这样说,是因为人们可以用无法操纵的变量设置辛普森悖论,或者不能直接对其进行操纵。

  2. 辛普森悖论是一个更普遍的问题的一部分,如果您添加更多的预测变量,回归系数会改变,但实际上没有必要翻转符号。

这是我在教学中使用的示例,说明了这两点:

我可以进行回归分析,以预测来自性别和身高的收入。我发现性别的系数 10,000 美元(即,比较一个身高相同的男人和女人,平均而言,这个男人会多赚10,000 美元),而身高系数 500 美元(即,比较两个男人或两个女人不同高度的平均高大的人会使$ 500多家每高度英寸)。

我如何解释这些系数?我觉得身高系数很容易解释(很容易想象将两个相同性别的不同身高的人进行比较),的确,在控制性别的情况下,身高回归似乎有些“错误” 身材矮小的人之间的差异可以通过男女之间的差异来“解释”。但是上述模型中的性别系数似乎很难解释:例如,为什么要比较一个身高66英寸的男人和一个女人?那将是一个矮个子男人和一个高个子女人的比较。所有这些推理似乎都是模糊的因果关系,但我认为使用潜在的结果来思考它是没有道理的。

我仔细考虑了一下(甚至在帖子中发表了评论),并认为这里有些事情需要更清楚地理解。

在解释性别之前,还可以。但我看不出比较矮个子和个高个子的女人背后的问题是什么。这是我的观点:实际上,这更有意义(假设男人的平均身高更高)。出于完全相同的原因,您不能比较“矮个子男人”和“矮个子女人”,即收入差异在某种程度上由身高差异来解释。高个子男人和高个子女人也是如此,矮个子女人和高个子男人更是如此(可以这么说)。因此,基本上只有在比较矮个子和高个子的情况下才消除身高的影响(这有助于解释性别系数)。难道不是流行的匹配模型背后的类似基础概念的钟声吗?

辛普森悖论背后的想法是,人口效应可能与亚群体效应不同。从某种意义上说,这与他的观点2和他承认不应单独控制身高(我们所说的是忽略变量偏差)有关。但是我不能将其与关于性别系数的争论联系起来。

也许您可以更清楚地表达它?或评论我的理解?


交叉验证着眼于总体中的随机子集,以尽量减少过度拟合和最佳概括。
EngrStudent-恢复莫妮卡

1
如果我正确理解了您的担忧,那么我认为您也可以通过观察Lord的悖论而受益。@article {lord67,作者= {Lord,FM},标题= {解释群体比较的悖论},期刊= {Psychical Bulletin},年份= {1967},卷= {68},页= {304- -305},关键字= {更改分数}} @article {lord69,作者= {Lord,FM},标题= {比较现有组别时的统计调整},期刊= {Psychical Bulletin},年份= {1969},数量= {72},页= {336--337},关键字= {更改得分}}
mdewey

1
犹大珍珠最近在辛普森悖论上发表了另一篇文章。我敢肯定他不同意盖尔曼的演讲。一次,第二点不是“悖论”。由于您所依据的条件而导致的估计值的逆转是一个数学事实。当您对这两种估计进行因果解释时,可能会导致自相矛盾。第二,为什么只限于可操纵原因?
NRH

Answers:


9

我不能完全确定您的问题,但是可以对他的主张和您对示例模型的困惑进行评论。

如果科学的兴趣在于安德鲁是不太清楚的高度调节性收入协会或性别调整高度收入关联。在因果模型框架中,性别会导致身高,但身高不会导致性别。因此,如果我们想要性别的影响,调整身高会引入调解人的偏见(因为富人更高,所以也可能是对撞机偏见!)。当我看到应用研究可以解释另一个方面时,我会感到困惑和有趣。模型中包含的“协变量”(混杂变量和精度变量)。它们是胡说八道,而只是提供足够的分层以进行必要的比较。如果您对推断基于性别的收入差异感兴趣,那么调整身高是错误的选择。

我同意反事实不是解释辛普森悖论的必要条件。它们可以仅仅是数据固有的特征。我认为粗略的和调整后的RR在某种意义上都是正确的,没有因果关系。当然,当目标是因果分析时,问题就更大了,而过度调整则暴露出非竞争性(夸大了OR)和样本量不足的问题。

在此提醒读者:辛普森悖论是一种非常特殊的现象,指的是这样一个实例,即在控制了一个混杂变量之后,一个关联翻转了方向。伯克利大学入学数据就是具有启发性的例子。在那里,粗略的居民代表表明妇女不太可能被伯克利接受。但是,一旦按部门分层,RR便显示出每个部门中女性被接纳的可能性更高。他们只是更有可能适用于拒绝许多人的困难部门。

现在,在因果推理理论中,我们会迷惑地认为,一个部门应用于 导致 性别。性别是内在的权利吗?好吧,是的,不是。Miettenen主张对此类问题采取“研究基础”的方法:人口是谁?并不是所有符合条件的学生,而是专门申请伯克利大学的学生。竞争更激烈的部门吸引了这些妇女向伯克利申请,而她们本来不会另外申请。扩展:一个非常聪明的女人想进入最好的工程程序。如果伯克利大学没有出色的工程学计划,那么她无论如何都不会向伯克利大学申请,而是会向麻省理工学院或CalPoly申请。因此,从这个角度来看,“申请学生”的人口,部门导致性别差异,并且是一个混杂因素。(注意:我是第一代大学生,所以对于哪些程序以什么闻名而不太了解)。

那么我们如何总结这些数据呢?这是真正的贝克莱更可能承认一个人谁比女人应用。它是真正的伯克利的部门更倾向于招收女性比男性承认。粗略和分层的RR是合理的措施,即使它们不是因果关系也是如此。这突显了我们作为统计学家的措辞要精确的重要性(谦虚的作者并不认为自己过于精确)。

混淆是一种与非竞争性不同的现象,后者是省略的可变偏差的另一种形式,但已知会对估计产生较小的影响。不像逻辑回归,非collapsibilty确实没有事业偏线性回归和审议的连续本来应该更彻底地描述格尔曼的例子。

安德鲁在其性别/身高调整后的收入模型中对性别系数的解释揭示了该模型假设的性质:线性假设。实际上,在线性模型中,可以进行男女之间的比较,因为对于特定的女性,我们可以预测即使没有被观察到,同样身高的男性也可能赚到多少。如果允许效果调整,情况也是如此,因此女性的趋势斜率与男性的斜率不同。另一方面,我认为怀抱相同身高的男人和女人并不疯狂,66英寸的身高确实是个矮个子。对我来说,这似乎是一个温和的预测,而不是粗略的推断。此外,由于可以清晰地陈述模型假设,因此可以帮助读者了解按性别分层的收入-身高协会所承载的信息是在不同年龄之间平均借入平均的男性和女性的样本。如果这样的关联是推论的对象,那么认真的统计学家显然会考虑效果修改的可能性。


2
很棒的讨论。作为一名统计学家,当人们谈论一项研究的结果时,这无休止地激怒了我,但不确定他们谈论的是边际效应还是条件效应。
Cliff AB

1

“例如,为什么要比较一个既有66英寸高的男人又有一个女人?那将是一个矮个子男人与一个高个子女人的比较

该模型假设收入取决于性别和身高。然而,身高产生更高收入的方式对于男人和女人而言可能并不相同。在一个男人可能还矮的身高上,女人可能被认为“足够高”。

以以下方式简化模型可能会很有用。

假设您想降低在大型服装零售商商店中担任店员的可能性,并考虑以下识别策略。

您会发现,雇主更有可能雇用达到一定最低高度的工人,其中“最低”是相对于性别的。

代替以厘米为单位测量高度,我们假设存在两个阈值,分别定义男人和女人的身高在哪个高度:男性> = 180 cm,女性> = 170 cm。

假设实际存在阈值(即雇主在女性和身高169cm或171cm之间确实有显着差异),并且它们是正确的阈值,则您可以构建一个定义高/矮公母的假人。身高不同的男人和女人仍然可能属于您的假人,并且与此同时,您的测量与该特定劳动力市场的真实动态是一致的。


-1

您是否要说(用更简单的话)典型的性别斗争说男人比女人有更多的机会,因为她们的收入高p%,这会自相矛盾吗?

也许这就是重点。我们倾向于看事物的外观,而不分析其潜在含义。

要超越辛普森悖论,我们必须回答以下问题:“与男人相比,女人从事相同数量的无偏工作赚多少钱?” 那么有人可以说他们必须怀孕并且要比同龄人更多地养育孩子,这是对的,但是重要的问题是,人们不得不叹息:“妇女事实上是妇女的机会更少”,使用条件统计进行分析会使我们看到,本质上趋向于机会均等,并且它们是与性别无关的其他因素,这使得统计看起来像与性别问题相关的歧视。


了解这样的分析不一定是因果关系或解释性的,而是描述现有现象的,可能是有用的。
AdamO'2
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.