罗纳德·费舍尔的主要统计贡献是什么?


13

理查德·道金斯(Richard Dawkins)将罗纳德·费舍尔(Ronald Fisher)描述为 “现代统计和实验设计之父”,费舍尔的维基百科传记中引用了这句话。安德斯·霍尔德 Anders Hald)也在他的数理统计史》一书中称他为 “几乎单枪匹马为现代统计科学奠定基础的天才” 。

我只是想知道他到底做了什么,所以人们给予他如此高的评价?


10
对于HSM来说,这将是一个很棒的职位。
Antoni Parellada

6
@Antoni我认为,在将来的某个时候,随着HSM的持续增长和蓬勃发展,HSM可能会成为统计历史问题的更好家。但是CV具有如此强大的专业知识,许多用户对历史方面都有真正的兴趣,因此CV可以说是目前最好的地方。(从长远来看,我认为CV可能会继续是解决“概念性”历史问题的更好的地方。)
Silverfish

3
我不认为这个问题可能是基于“观点”的本质。我同意@AntoniParellada的观点:如果这个问题不属于“科学和数学史”网站上的内容,则不清楚会是什么。我们欠SE同事将其迁移到那里。原来的框架非常好。
gung-恢复莫妮卡

3
我同意,“很好的问题”,但也许不在这里。费舍尔的著作已被收集到相当数量的《数理统计贡献》中,可从任何二手书店轻松获得。有关书评的信息,请参见:jstor.org/stable/2332332我个人无法添加更好的单词,只能参考Efron jstor.org/stable/2676745。确实有趣的是,添加信息是历史学家的观点。(或哲学家,因为不同的统计观点是一个普遍的问题,而我实际上并没有真正理解它,即我使用了所有这些观点)
Sextus Empiricus

7
@MatthewDrury我们有一个相对流行的[history]标签。历史问题是我们网站上的主题。如果这里有什么话题,即使它也在其他话题上,我们也不应恕我直言将其迁移。
变形虫说莫妮卡(Reonica Monica)

Answers:


19

写下问题的答案非常困难

罗纳德·费舍尔的主要统计贡献是什么?

因为已经有许多杰出的作家(包括杰出的统计学家)创作了许多关于该主题的杰出作品,例如:

这些作品很难通过互联网问答板上的几行简单匹配。最重要的是,要抓住费舍尔的全部想法并不是一件容易的事,就像埃夫隆在费舍尔的著作中写道:

评估渔业统计数据重要性的一个困难是很难仅说出它是什么。费舍尔(Fisher)有许多重要的思想,其中一些思想(例如随机推理和条件性)是矛盾的。在经济学上,马克思,亚当·史密斯和凯恩斯有点像是同一个人。


费舍尔是先驱

费舍尔贡献的一个简单但非常好的来源是维基百科。只需阅读有关统计数据历史的文章(或者您可以使用任何其他文字),您就可以对Fisher贡献的数量和重要性有所了解。

您还将看到,在一定程度上,时间,地点和运气使Fisher成为了杰出的贡献者。费舍尔(Fisher)是20世纪初期的重要且有影响力的统计学家,当时它创建了应用统计的基本基础,并且领域相对较小(与18和19世纪的数学时期相比)。

当费舍尔(Fisher)上台时,大学的第一本统计学杂志和第一本统计学系才刚刚开始。在20世纪初之前,主要有进行回归的方法和一些关于残差项和误差分布的想法,这些想法被用于天文学等领域。

测量误差和结果概率的概念。这种类型的数学和逻辑(更接近于纯粹的数学,并且...被认为是更高贵的,并且在那个年代没有受到严肃的数学家的谴责),已被广泛应用于费舍尔选择的领域:遗传学,进化,生物学,农业。自从杰出的数学家费舍尔为这些早期发展做出了重大贡献(或者甚至被认为是这些发展的主要推动力)以来,他的工作就一直处于统计学史上的重要位置。

基本概念和工具

如果您查看有关统计(特别是数学概念或推论)的入门书中的主题,则可以将Fisher视为主要贡献者。这也是费舍尔谁写的第一个,也是最有影响力的,介绍统计的书籍

  • 研究人员的统计方法(1925)
  • 实验设计(1935年)(使用茶杯实验来解释随机性,拉丁方的使用,零假设,重要性,敏感性/ 功效以及基本上所有内容;耶茨为这项工作提供了历史背景)

请注意,这些书籍的在线版本存在SMRWDE部分(请参阅10月29日,阅读)

从1912年到1925年,费舍尔:

  • 帮助改善卡方检验(Pearson和其他人多年来对自由度数有误),
  • 提供了一个精确的测试来计算拟合优度的p值,而观察值却很少(以他的名字命名为Fisher精确测试),
  • 为戈塞特的“学生分布”了一个证明(作为大学生)(并在他的小观测数研究中得到了进一步发展,例如在使用样本统计时使用自由度而不是样本大小想法)(请参阅费舍尔女儿琼·费舍尔·盒(Joan Fisher Box)的历史描述N1N
  • 对方F分布(也以他命名)进行了分析,并且
  • (他在大学时做过的另一件“小”事情)正在开发最大可能性的基础和概念Aldrich的RA Fisher和《最大似然法》)。

因此大致涵盖了当前介绍文本使用的大多数基本推理工具。在进行统计工作时,费舍尔解决了遗传学中的重大问题,这使像理查德·道金斯这样的人非常钦佩他。

术语

Fisher引入了许多概念和术语并改进了统计语言。这个问答站点上最近有两个问题与费舍尔有关。问题是为什么统计中会有如此多的变量平方为什么我们经常使用范数而不是范数L2L1。费舍尔“证明”范数比范数更好(更有效)(假定理想的高斯分布,费舍尔后来同意,“真实”误差并不总是正确的),并引入了推导术语同时将其作为“有效统计量”“足够统计量”,并引入术语“方差”L2L1(在他的1920年论文《通过均值误差和均方误差确定观测精度的方法的数学观察》中)。

地基

费舍尔(Fisher)在1922年发表的《理论统计的数学基础》一文中简要概述了主要概念,仅列举了以下定义列表:“位置中心”,“一致性”,“分布”,“效率”,“估计”,“内部准确性”,“等统计区域”,“可能性”,“位置”,“最佳”,“缩放”,“规格”,“充分性”,“有效性”。这就要求历史学家了解费舍尔在这里是概念的创始者在这里所做的贡献,这也与埃夫隆的陈述有关。很难把握谁到底贡献了什么。

在这篇文章中费舍尔开始提的应用方面,如“平均值”和“差异”到的问题真实分布值以及估计值。

(我将尽量避免将Fisher放在“学校”中的某个地方,例如常客或贝叶斯主义者。我会说他对所遇到的任何问题都“足够”实际)。

进阶概念

Fisher在其进一步的工作中提出了线性判别分析的早期概念:

四个度量的什么线性函数将使特定平均值与物种内标准偏差之间的差异之比最大化?X=λ1x1+λ2x2+λ3x3+λ4x4

在分类问题中使用多重度量,1936年

费舍尔(Fisher)进一步探索了按可能性估计的概念,并以他的名字命名了两个概念,即费舍尔信息Fisher information)和费舍尔(Fisher)分数。请参阅统计估计理论,1925数学似然的两个新属性,1934,和归纳推理的逻辑,1935

更多链接:

  • 约翰·奥尔德里奇(John Aldrich)撰写的《 RA Fisher指南》。巨大的资料来源,即使不是最大的资料来源,也提供了有关费舍尔的信息,还有更多的参考文献。
  • 迈克尔·哈迪(Michael Hardy)关于Mathoverflow的答案,关于一个最伟大的数学家的问题:https ://mathoverflow.net/a/173374

StackExchangeStrike撰写


谢谢@Martijn!我仔细检查了您的答案,并在此处和此处进行了一些小修改,主要是为了使格式更清晰,并修正了一些错字。我希望你不会介意。我很高兴对这个答案表示赞赏。很好的贡献。拥有所有这些参考特别好。
变形虫说莫妮卡(Reonica Monica)

根本没有,很棒的编辑,这就是为什么我将它做成社区Wiki。这是一个大问题要回答。尽管我是费舍尔(Fisher)的忠实粉丝,并且浏览了他的几篇文章,但我感到我不应该回答这个(已满载)问题。
Sextus Empiricus

我在聊天中给您的答案做广告,现在我发现它成为该话题中最受欢迎的答案。我认为这是当之无愧的。
变形虫说莫妮卡(Reonica)Monica

8

他发明了一些概念:充足性,效率,ANOVA,灵敏性,p值,可能还包含其他一些概念(最重要的是实验设计)。

似然函数和mle的先兆,但被他普及了。


9
+1尽管费舍尔肯定会因此而获得荣誉,但p值的概念似乎至少在非正式的情况下就存在于FIsher的工作之前。皮尔森(Pearson)在其1900年的论文中关于卡方拟合优度检验中清楚地计算了p值,并把他的计算结果(如果只是顺便描述)当作是显而易见的,可以接受的事情。有人给人一种感觉,那就是它并不是该论文中引入的新概念。当然,在许多概念上可能会说类似的话……在人们将其正式化之前,它们经常在“周围”存在一段时间。
Glen_b-恢复莫妮卡

8

罗纳德·艾尔默·费舍尔爵士(Sir Ronald Aylmer Fisher)在实验设计以及现代统计理论和实践的众多方面享有盛誉。他的一些最重要的贡献包括显着性检验(Bandyopadhyay和Cherry 2011),最大似然估计(MLE),置换(重采样)分布,充分性,渐近最优理论(Efron 1998)以及包括随机化,复制,阻塞,混淆和方差分析(ANOVA)。同样值得注意的是他对孟德尔豌豆植物实验的争论。他声称这“实在太好了”。

考虑阅读Efron(1998)的论文“ 21世纪的RA Fisher”。让我引用摘要:

费舍尔是20世纪统计中最重要的人物。这篇演讲探讨了他对现代统计思维的影响,试图预测我们可以期望21世纪的渔夫。费舍尔(Fisher)的哲学的特征是,贝叶斯(Bayesian)观点与常人观点之间的一系列精妙妥协,并辅以一些独特的特征,这些特征在应用问题中特别有用。考察了当前的几个研究主题,着眼于渔业的影响力或缺乏影响力,以及这对未来统计发展的影响。基于1996年Fisher的演讲,本文紧随该演讲的内容。

参考文献

  • Bandyopadhyay,Prasanta S.和Steve Cherry。“基本概率和统计:入门”。统计哲学7(2011):53。

  • 埃弗隆·布拉德利。“ 21世纪的RA Fisher。” 统计科学(1998):95-114。


1
他的意义测试版本是基准推理,一直存在争议,并未像Neyman-Pearson理论那样接受。其他贡献是巨大的,也是统计基础的一部分。
Michael R. Chernick

3
好吧,基准推论现在似乎找到了一些粉丝。我注意到没有人提到Fisher信息,也没有人提到有用的准则,例如“在随机化时进行分析”。
比约恩

Bjorn-是的,肯定错过了Fisher信息部分。可能是因为我从纸上抄袭了这段文字,所以写了有关re:fisher的信息。哈!
杰西卡·伯内特
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.