数学家希望获得等同于质量统计程度的知识


77

我知道人们喜欢关闭重复项,因此我要求参考来开始学习统计信息(如此)。

我拥有数学博士学位,但从未学过统计学。顶尖的BS统计学位获得等效知识的最短途径是什么,当我达到这一水平时如何衡量。

如果一本书的清单就足够了(假设我做练习可以说),那就太好了。是的,我希望解决问题是学习它的一个隐含部分,但我想尽可能快地实现快速跟踪。除非这是统计学专业人士通常会学到的内容,否则我不会寻求严格的治疗。


1
您获得博士学位的数学领域是什么?这可能是相关的。
mpiktas 2011年

7
您能否与我们分享为什么要学习统计信息?好奇心?需要进行项目或研究吗?想换工作吗?需要教一些课程吗?是否想与统计学家作为理论家合作?
whuber

5
我认为开发特定领域的专业知识几乎也很重要。许多统计数据正在学习与特定领域相关的模型。
特里斯坦,

10
尝试逆转“统计学家想要等同于高质量数学知识的知识”-不可能有任何捷径。
概率

1
“我知道人们喜欢关闭重复项”使我发笑。
Mustafa S Eisa

Answers:


77

(非常)短篇小说

长话短说,从某种意义上说,统计就像任何其他技术领域一样:没有快速的轨道

很长的故事

在美国,统计学专业的学士学位课程相对较少,我认为这是事实,原因是很难将学习统计学所需的全部知识纳入本科课程。在有大量普通教育要求的大学中尤其如此。

开发必要的技能(数学,计算和直观技能)需要大量的精力和时间。一旦学生掌握了微积分以及相当数量的线性和矩阵代数,就可以在相当不错的“操作”水平上开始理解统计了。但是,任何应用统计学家都知道,在不符合Cookie切割器或基于配方的统计方法的领域中找到自己很容易。要真正了解表面之下发生的事情,这是先决条件在当今的世界中,数学和计算成熟度只有在后来的本科训练中才能真正实现。这是真正的统计培训主要从美国的MS级别开始的原因之一(印度,其专门的ISI则略有不同。对于某些加拿大的教育可能会提出类似的论点。以欧洲或俄罗斯为基础的本科统计教育,以便有足够的见解。)

几乎所有(有趣的)工作都需要MS级教育,而真正有趣的(我认为)工作本质上需要博士学位水平。

看来您拥有数学博士学位,尽管我们不知道在哪个领域,但是我为我提供了一些更接近MS级教育的建议。我附上一些括号,以解释这些选择。

  1. D. Huff,《如何撒谎》。(非常快速,容易阅读。显示了许多概念性想法和陷阱,尤其是在向外行人提供统计信息时。)
  2. Mood,Graybill和Boes,《统计理论导论》,第三版,1974年。(MS级别的理论统计入门。您将学习在经典的,频频的框架中进行的抽样分布,点估计和假设检验。意见是,这通常比Casella&Berger或Rice的现代同类产品更好,并且更先进。)
  3. Seber&Lee,线性回归分析,第二版。(列出了线性模型的点估计和假设检验背后的理论,这可能是应用统计学中最重要的理解主题。由于您可能具有良好的线性代数背景,因此您应该能够立即理解几何上的情况,这提供了很多直觉。还提供了与模型选择中的评估问题,偏离假设,预测以及线性模型的健壮版本相关的良好信息。)
  4. Hastie,Tibshirani和Friedman,《统计学习的要素》,第二版,2009年。(这本书比上一本更具应用感,并且广泛涵盖了许多现代机器学习主题。这里的主要贡献在于提供了统计解释。许多机器学习的想法,尤其是在量化此类模型中的不确定性方面很有价值。这在典型的机器学习书中往往没有得到解决。可在此处免费免费获得。)
  5. A. Agresti,分类数据分析,第二版。(很好地介绍了如何在统计框架中处理离散数据。良好的理论和良好的示例。也许在某些方面是传统的。)
  6. Boyd和Vandenberghe,凸优化。(许多最流行的现代统计估计和假设检验问题都可以表述为凸优化问题。这也适用于许多机器学习技术,例如SVM。具有更广泛的理解并能够识别凸程序等问题我认为这非常有价值。可在此处免费免费获得。)
  7. Efron和Tibshirani,《 Bootstrap入门》。(您至少应该熟悉引导程序和相关技术。对于一本教科书,这是一种快速且容易阅读的方法。)
  8. J. Liu,《科学计算中的蒙特卡洛策略》或P. Glasserman,《金融工程中的蒙特卡洛方法》。(后者听起来很像是针对特定的应用领域,但是我认为它将为所有最重要的技术提供一个很好的概述和实际示例。过去十年左右的时间里,金融工程应用推动了相当多的蒙特卡洛研究)
  9. E. Tufte,定量信息的可视化显示。(即使是统计学家,数据的良好可视化和表示方式也被[高度]低估了。)
  10. J. Tukey,探索性数据分析。(标准。老歌,但好东西。有些人可能说过时了,但仍然值得一看。)

补体

这是其他一些有用的书,其中大多数是更高级的,理论和/或辅助性质的书。

  1. FA Graybill,线性模型的理论和应用。(过时的,可怕的排版,但涵盖了Seber&Lee的所有相同领域,而且还有更多。我说过时的字体是因为更现代的处理方式可能会倾向于使用SVD来统一和简化很多技术和证明。)
  2. FA Graybill,矩阵及其在统计中的应用。(上面的同伴文本。大量良好的矩阵代数结果可用于此处的统计。很棒的参考资料。)
  3. 模式识别的概率论 Devroye,Gyorfi和Lugosi 。(有关量化分类问题性能的严格和理论文章。)
  4. Brockwell&Davis,《时间序列:理论与方法》。(经典的时序分析。理论上的处理。对于更多应用的语言,Box,Jenkins&Reinsel或Ruey Tsay的著作很不错。)
  5. Motwani和Raghavan,随机算法。(计算算法的概率方法和分析。)
  6. D. Williams,《概率与马丁格尔斯》和/或R. Durrett,《概率:理论与实例》。(例如,如果您已经在DL Cohn级别上看过量度理论,但可能没有概率论。如果您已经了解量度理论,那么这两种方法都有助于快速掌握。)
  7. F. Harrell,回归建模策略。(不如统计学习元素 [ESL]好,但是事情却有所不同且有趣。与ESL相比,它涵盖了更多的“传统”应用统计主题,因此当然值得一游。)

更高级的(博士级)文本

  1. Lehmann和Casella,点估计理论。(博士学位的点估计处理。这本书的部分挑战是阅读并弄清楚什么是错别字,什么不是错别字。当您很快意识到自己的错字时,您就会知道自己明白了。有很多练习这种类型,尤其是当您深入研究问题时。)

  2. Lehmann和Romano,检验统计假设。(博士学位水平的假设检验处理。错别字不如上面的TPE。)

  3. A. van der Vaart,渐近统计。(这是一本关于统计渐进理论的精美书,在应用领域有很好的提示。虽然不是一本应用书。我唯一的疑问是,使用了一些相当奇怪的符号,并且细节有时被掩盖了。)


1
@主要的前苏联大学有独立的本科统计学研究。例如,在维尔纽斯大学,您可以获得统计学士学位。从我对学生的看法中,我完全同意,有趣的工作需要硕士甚至博士学位的教育。
mpiktas,2011年

1
@cardinal,@mpiktas在BS学位4年+在MS学位2年+在博士学位4年使得十年可以学到一些有趣的东西:) 如果可能的话,我会给予。大多数书对我来说都是新书。+
Dmitrij Celov

2
@John Salvatier,您是正确的,这些方法未在本文中介绍。再说一遍,这更让我吃惊,特别是因为本文的主要重点不是算法。也就是说,作者在引言(第13页)中直接解决了您的担忧。
主教

2
@cardinal:斯堪的纳维亚大学通常也提供学士学位。话虽这么说,我认为统计学家对自己的看法太过严肃了。我不同意您需要博士学位才​​能获得“有趣”的工作。我相信随着科学和研究的发展,越来越多的跨学科统计已被应用到来自许多不同领域的研究中。在影响力较高的期刊上,有一半的文章进行了可疑的统计分析,即使在问题的原始背景/领域中可能没有任何意义,也只是为了满足需求。
posdef,2011年

1
@cardinal Mood本书是一个很好的建议,因为如今很难找到一本足以对具有数学背景的人来说足够正式的统计学入门书。有人读过这本书新书吗?Panateros,“数学家的统计资料” springer.com/us/book/9783319283395
Igor Fobia,

11

我不能代表更严格的学校,但是我在加利福尼亚大学戴维斯分校的一般统计专业(我学校中最严格的)获得理学学士学位,并且相当依赖严格性和派生性。数学博士学位会有所帮助,因为您将在实际分析和线性代数方面拥有非常强的背景知识-统计学有用的技能。我的统计计划的课程工作中约有50%用于支持基础知识(线性代数,实数分析,微积分,概率,估计),其余50%用于依赖基础知识的专业主题(非参数,计算,ANOVA /回归,时间序列,贝叶斯分析)。
一旦掌握了基础知识,跳到具体细节通常就不会太困难。我班上的大多数人都在靠证明和真实分析而挣扎,并且容易掌握统计概念,因此,具有数学背景的人无疑会有所帮助。话虽如此,以下两篇文章很好地涵盖了统计领域所涵盖的许多主题。顺便提一下,两者都是在您提供的链接中推荐的,所以我不会说您的问题和您所链接的问题不一定无关。

统计的数学方法,Harald Cramer着

《全部统计资料:统计推断简明课程》,作者:拉里·瓦瑟曼(Larry Wasserman)


3
+1所有统计信息:这将是一个不错的起点。
西蒙·伯恩

1
加州大学戴维斯分校的课程看起来不错,我认为您会获得很好的教育。我不会认为它比其他地方“不那么严格”。我认为在他们的“综合BS / MS学位” 页面上的评论很有趣,并且与该主题相关:“对统计学家的需求很高,但是拥有统计学学士学位的人所获得的知识和技能通常不足以满足[政府或工业]工作场所的需求。”
主教

9

英国皇家统计学会提供统计学专业的研究生文凭,其水平达到良好的学士学位。可以从他们的网站上获得教学大纲,阅读清单和以前的论文。我知道数学家会使用它来加快统计的速度。参加考试(正式地或在您自己学习的舒适程度中)可能是衡量您何时到达的有用方法。


3
研究生文凭考试实际上是最后一年的本科考试;出于“分段”目的,可以先获取较低级别的证书。如果我没记错的话,除了香港(有自己的统计协会和考试)以外,全世界都可以使用RSS考试。另一种选择是英国开放大学的远程学习提供的统计学本科文凭,但在全球范围内也可以使用。该级别比RSS Grad Dip的级别略低,因此可以将其视为准备工作。作为一门讲授的课程,它实际上要贵得多。
银鱼

5

我将访问顶级统计学校的课程网站,写下他们在本科课程中使用的书,查看哪些书在亚马逊上获得很高的评价,并在您的公共/大学图书馆中进行订购。

一些学校要考虑:

用各种演讲视频站点(例如MIT OCW和videolectures.net)补充文本。

加州理工学院没有统计学的本科学位,但是遵循他们的本科统计学课程的课程不会出错。


1
这似乎有点奇怪。据我所知,卡耐基梅隆大学是唯一的那个列表(正式)提供统计的本科学位学校。加州理工学院和麻省理工学院都没有统计学专业的研究生课程。
主教

@cardinal。你为什么要怀疑我?:)我在那些优秀机构中加入了本科生统计课程的链接。同样,最好的学校提供​​的混合课程和配对课程会从较差的学校获得学位的道路上胜出。
尼尔·麦圭根

2
OCW当然是一个很好的资源,也是一个伟大的倡议。毫无疑问。关于您的断言,“最好的学校”的融合和匹配是一个更好的解决方案,我发现这尤其令人怀疑,特别是对于本科学习而言。一个有上进心的学生注定要在其中任何一所学校接受很好的本科教育,而在许多“较差”的学校中都可以找到同等或更好的本科教育。我会说,您列出的学校确实会“胜出”以获得研究生教育。
主教

2
实际上,这是我尝试的第一件事。在发布问题之前,我尝试过此操作。查找课程列表并不难,但是要查找有关哪些书籍实际用于这些课程以及涵盖这些书籍的哪些部分的信息要困难得多。
约翰·罗伯逊,

3

我看过席尔维(Silvey)的统计推断,这些数学推断需要一些工作日的统计知识。这是一本小书,按权利应该便宜。查看http://www.amazon.com/Statistical-Inference-Monographs-Statistics-Probability/dp/0412138204/ref=sr_1_1?ie=UTF8&s=books&qid=1298750064&sr=1-1,这似乎是便宜的二手。

它很老,并且专注于经典统计。尽管它不是很抽象,但它是针对一定程度的数学读者的-许多练习来自剑桥(英国)数学统计文凭,基本上是理科硕士。


3

关于你的知识测试:你可以参加一些数据挖掘/数据分析比赛,如1234,看你的分数如何比别人。

答案中有很多关于数学统计学教科书的指针。我想补充一下相关主题:

  • 实证社会研究部分,包括抽样理论,社会人口统计学和区域标准
  • 数据管理,包括有关数据库的知识(编写SQL查询,通用数据库方案)
  • 交流,如何以观众保持清醒的方式呈现结果(可视化方法)

免责声明:我不是统计学家,这只是我的2美分


3

ET Jaynes撰写的“概率论:科学的逻辑:原理和基本应用第1卷”,剑桥大学出版社,2003年,在正确的水平上,对于贝叶斯统计方面来说,它几乎是必读的。我期待有关常客性方面的建议(我有很多专着,但很少有很好的一般性教科书)。


3
我建议对于想要成为一名出色的统计学家,频率论者,贝叶斯主义者或其他任何人的来说,这是一本必读的书。
概率

10
我不同意,在这种情况下,Jaynes的书是一个糟糕的建议:1)注释草率且不规范,这使得很难与其他资料进行交叉引用; 2)他s之以鼻,陷入愚蠢而无关紧要的争论中(OP要求“最短路线”)3)还有错误(例如边缘化悖论)
Simon Byrne

1
@Dikran Marsupial,您是否拥有有关统计推断的舍弗维文字?我一直在考虑是否购买它,因此感到好奇,因为您似乎非常认同贝叶斯方法。
主教

1
我不会说我非常赞同贝叶斯方法。这是我最了解的方法,并非一回事。本质上,我是一名内心的工程师,并且我希望工具箱中的两个工具都保持良好状态!我们应该以正确理解每种方法的优缺点为目标。我还没有什叶派教士的书,但是我确实阅读了他关于贝叶斯因素的论文,这似乎对我来说是有缺陷的(我将看看是否可以找到它,并提出问题让别人向我解释!)。
Dikran有袋动物

@Dikran,您的(潜在)问题听起来很有趣。我期待在其上发表文章。
主教

3

我来自计算机科学背景,专注于机器学习。但是,在使用Bishop的书https://www.microsoft.com/zh-cn/research/people/cmbishop/#!prml-book参加了模式识别课程之后,我真的真正开始理解(并且更重要的是应用)统计信息。

这是麻省理工学院的一些课程幻灯片:http :
//www.ai.mit.edu/courses/6.867-f03/lectures.html

这只会为您提供背景(+一些matlab代码)以将统计信息用于实际工作问题,并且肯定在应用方面更多。

但是,这在很大程度上取决于您想用自己的知识做什么。要衡量您的水平,您可能需要浏览某所大学的开放课程软件以获取高级统计课程,以检查是否知道所涉及的主题。只是我的5美分。


1

我认为斯坦福大学在灵活性方面提供了最佳资源。他们甚至在线上都有机器学习课程,可以为您提供有关R语言中设计算法的丰富知识基础。在Google上进行搜索,它会将您重定向到他们的Lagunita页面,在那里他们提供了一些有趣的课程,其中大多数他们是自由的。我有PDF格式的Tibshirani的书,《统计学习入门》和《统计学习要素》,它们都是非常好的资源。

由于您是数学家,因此我仍然建议您不要快速跟踪,因为如果您开始进行认真的机器学习,那将不会为您提供扎实的基础,将来您可能会发现这对您很有帮助。将统计数据视为数学的一个分支,以从数据中获取洞察力,这需要做一些工作。除此之外,还有大量的在线资源,约翰霍普金斯大学提供与斯坦福大学类似的资源。尽管经验总能带来回报,但受人尊敬的证书将始终巩固这一基础。您还可以考虑要输入的特定字段。我的意思是说您想参加文本分析还是在金融中应用数学和统计技能。我属于后一类,因此我获得了计量经济学学位,研究了金融+统计。组合永远是非常好的。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.