回归到“思考,快速和慢速”中的均值


14

丹尼尔·卡尼曼(Daniel Kahneman)在《快与慢的思考》中提出了以下假设问题:

(第186页)朱莉目前在州立大学任教。她四岁时能流利阅读。她的平均成绩(GPA)是多少?

他的目的是说明在做出有关某些统计数据的预测时,我们通常如何无法解释均值的回归。在随后的讨论中,他建议:

(第190页)回想一下,在当前案例中,阅读年龄和GPA两项测量之间的相关性等于决定因素中共享因素的比例。您对该比例的最佳猜测是什么?我最乐观的猜测是大约30%。假定此估计,我们将需要产生一个无偏预测。以下是通过四个简单步骤到达那里的说明:

  1. 首先估算平均GPA。
  2. 确定符合您对证据印象的GPA。
  3. 估计阅读早熟与GPA之间的相关性。
  4. 如果相关系数是0.30,则将平均值的30%距离移到匹配的GPA。

我对他的建议的解释如下:

  1. 使用“她四岁时能流利阅读”为朱莉的阅读早熟建立标准分数。
  2. 确定具有相应标准分数的GPA。(如果 GPA和阅读早熟之间的相关性是完美的,可以预测的合理GPA将与此标准分数相对应。)
  3. 估计GPA差异的百分比可以通过阅读早熟的差异来解释。(在这种情况下,我假设他指的是“相关”的确定系数?)
  4. 由于朱莉的阅读早熟标准分数的只有30%可以由解释她的GPA标准分数的因素来解释,因此我们仅有理由预测朱莉的GPA标准分数将是该分数的30%在完全相关的情况下。

我对卡尼曼程序的解释正确吗?如果是这样,他的程序是否有更正式的数学证明,尤其是步骤4?通常,两个变量之间的相关性与其标准分数的变化/差异之间是什么关系?

Answers:


2

我对卡尼曼程序的解释正确吗?

这很难说,因为Kahneman的步骤2并不是很精确地表述:“确定与您对证据的印象相匹配的GPA”-这到底是什么意思?如果对某人的印象进行了很好的校准,则无需针对均值进行校正。如果某人的印象严重差强人意,那么他们应该更纠正甚至更强。

所以我同意@AndyW的观点,卡尼曼的建议只是一个经验法则。

žž

[...]他的程序是否有更正式的数学依据,尤其是步骤4?通常,两个变量之间的相关性与其标准分数的变化/差异之间是什么关系?

ÿXžρ

ÿ=ρX

Xÿρ

这就是所谓的“均值回归”。您可以在Wikipedia的讨论中看到一些公式和派生词。


8

您的数字顺序与Kahneman报价不匹配。因此,您似乎可能错过了总体要点。

卡尼曼的观点最重要。这意味着从字面上估计每个人的平均GPA。该建议背后的观点是它是您的锚点。您给出的任何预测都应参考该锚点周围的变化。我不确定在您的任何观点上是否都看到了这一步!

Kahneman使用首字母缩略词WYSIATI,您所看到的就是全部。这是人类倾向于高估当前可用信息的重要性的趋势。对于许多人而言,有关阅读能力的信息会使人们认为朱莉很聪明,因此人们会猜测一个聪明人的GPA。

但是,孩子四岁时的行为几乎没有与成人行为有关的信息。在做出预测时,最好忽略它。它只会使您偏离锚点少量。同样,人们最初对聪明人的GPA的猜测可能非常不准确。由于选择,大多数大学前辈的智力都高于平均水平。

除了朱莉四岁时的阅读能力外,问题中实际上还有其他一些隐藏的信息。

  • 朱莉很可能是女性名字
  • 她正在上州立大学
  • 她是大四学生

我怀疑所有这三个特征均比总体学生人数略有提高。例如,我打赌长者的GPA可能比Sophmores的高,因为GPA差的学生辍学了。

因此,卡尼曼的程序(作为假设)会像这样。

  1. 州立大学女生的平均GPA为3.1。
  2. 我猜是基于朱莉4岁的高级阅读能力,她的GPA为3.8
  3. 我猜4岁时的阅读能力与GPA相关系数为0.3
  4. 那么在3.1和3.8之间的距离中有30%是3.3(即3.1 + (3.8-3.1)*0.3

因此,在此假设下,朱莉的GPA最终猜测为3.3。

卡尼曼方法中均值的回归是,步骤2可能是对可用信息重要性的高估。因此,更好的策略是将我们的预测回归到总体均值。第3步和第4步是(临时)估算要回归多少的方法。


我了解该程序背后的直觉,但不了解其数学依据。我的解释是,估计平均GPA的目的是允许人们根据标准分数来估计特定的GPA;否则,它们就无法与阅读早熟相提并论。(续)
配给定

1
卡尼曼提到大多数人认为GPA = 3.7或3.8,可能与他们与朱莉的阅读早熟相关的标准分数相对应,但也隐含地假设这两个变量之间的相关性是完美的。我对第4步是基于直觉的经验法则还是真正的,统计上有效的程序感到困惑(即,一个人能否将标准分数相加,然后根据相关性取其比例?)。如果仅是外行的经验法则,是否存在更严格的统计近似方法?
配给率

通过“累加”,我指的是我们的假设:(1)朱莉的标准成绩GPA的某些比例由可以解释其阅读早熟的因素解释,(2)她的标准成绩GPA的其余比例由因素解释对于解释GPA而言,其独特之处在于:(3)这些贡献的总和等于我们为朱莉预测的最终标准分数GPA,并且(4)我们可以通过简单地采用一部分有偏见的预测来更正我们的预测。这样处理一定比例的标准偏差(而不是按其平方根计算)是否有效?
Rations

这是一个临时规则。第二步和第三步在逻辑上不一定相互一致。(它们是表达相同信息的两种不同方式,一种是效果大小,另一种是标准化效果大小。)
Andy W
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.