为什么将回归问题称为“回归”问题?


Answers:


34

弗朗西斯·高尔顿(Francis Galton)在1886年发表的论文《遗传性身材向平庸的回归》中使用了“回归”一词。据我所知,他仅在回归均值的情况下使用该术语。然后,该术语被其他人采用,以或多或少地获得今天作为通用统计方法所具有的含义。


15
高尔顿(Galton)得出线性近似值,从那篇论文中根据父亲的身高估算儿子的身高。他的方程式很适合,因此,一个平均身高的父亲会生一个平均身高的儿子,但是一个比平均身高的父亲高一个儿子,则比平均身高的父亲高2/3。比平均短。可以认为这是简单的线性回归(今天的含义)。当然,今天回归具有更广泛的含义:它是进行连续预测的任何模型。有趣的是,他对该单词的原始用法已发生了多少变化。
rm999

3
NRH的回答是正确的。下面的链接给出了弗朗西斯·高尔顿的纸张有更多的细节“回归平庸走向遗传性身材” blog.minitab.com/blog/statistics-and-quality-data-analysis/...
拉夫辛格

统计界是否该用一个更简单明了的术语(也许是“公式化预测变量”)来代替“回归”一词了?
Aviad Rozenhek

4

与进步相反,我们正在回归均值,即回归。因此,术语回归!我认为它被捡起并卡住了。


2

@Mark White已经提到了链接,但是对于那些没有太多时间检查链接的人,这是正确引用的确切答案:

“回归”的由来

“回归”一词由弗朗西斯·加尔顿(Francis Galton)在19世纪提出,用以描述一种生物现象。这种现象是,高祖先的后代的身高趋于向正常平均值下降(这种现象也称为向均值回归)(Galton,重印于1989年)。对于高尔顿而言,回归仅具有生物学意义(加尔顿,1887年),但后来乌德尼·尤尔(Udny Yule)和卡尔·皮尔森 Karl Pearson)将他的工作扩展到了更一般的统计背景(皮尔森,1903年)。

参考文献

https://zh.wikipedia.org/wiki/Regression_analysis#历史

高尔顿(F.)(1877)。遗传的典型规律。三,Nature,15(389), 512-514。

加尔顿,F。(重印于1989年)。亲属关系和相关性。统计科学,4(2), 80-86。

皮尔逊(K.)(1903)。祖先遗传法则。Biometrika,2(2), 211-228。


高尔顿的回归(如“均值回归”)是有道理的。但是我不明白使用“回归”一词来表示“从独立变量到结果变量学习公式”
Aviad Rozenhek

1
它更普遍地意味着,但是机器学习使用回归,但是尽管流行,错误的观点,但是回归并不是机器学习技术。统计学习与机器学习是分开的,但是一般来说,机器学习的支持者会采用统计方法并将其错误地标记为机器学习,因此会出现明显的不一致之处。高尔顿的回归是回归。它与建模/预测趋势有关。
LSC

0

“回归”来自“回归”,而“回归”又来自拉丁语“回归”-返回(返回某物)。

从这种意义上讲,回归是一种技术,它可以使“从混乱,难以解释的数据返回”到更清晰,更有意义的模型。作为物理学家,我喜欢这个想法,因为物理学家将自然现象视为相对简单的自然定律的多种可能结果。

换句话说,“回归”一词似乎暗示着数据只是“统计模型”的可见的,有形的影响。换句话说,模型是第一位的,您的愿望是使用数据“返回”原始数据。


0

据我所知regression,统计意义上的单词是对一个变量的平均值与其他变量的对应值之间关系的度量。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.