Answers:
从Hastie,Tibshirani和Friedman 的统计学习元素http://www-stat.stanford.edu/~tibs/ElemStatLearn/应该在任何统计学家的图书馆中!
这不是一本书,但我最近发现了美国心理学家雅各布·科恩(Jacob Cohen)的一篇文章,题为“到目前为止我学到的东西”。可在此处以pdf格式获得。
我不会认为这两个书都应该被视为“最有影响力的书……(对统计学家来说)”,但是对于那些刚开始学习该主题的人来说,有两本有用的书是:
威廉·克利夫兰(William Cleveland)的书“图形数据的元素”或他的书“可视化数据”
我认为每个统计学家都应该阅读斯蒂格勒的《统计史:1900年之前的不确定性的度量》
它写的精美,透彻,不是历史学家的观点,而是数学家的观点,因此它不能避免技术细节。
我说的是Tufte和Freakonomics的可视化定量信息显示,带来了一些乐趣。
安德鲁·盖尔曼(Andrew Gelman)有趣的书籍推荐如下:
http://thebrowser.com/interviews/andrew-gelman-on-statistics
除了格雷厄姆(Graham)建议的“统计史”之外,另一本值得一看的斯蒂格勒书是
在数学/基础方面:HaraldCramér的统计学数学方法。
为了明确说明社会科学期刊文章的内容(在撰写或进行同行评审时提供帮助),我喜欢《社会科学定量方法评论者指南》。我特别喜欢餐桌旁餐,它是论文(文章,论文,学位论文)应包含的最低要求的概要。这些章节通过分析技术分开,这很不错。我认为这本书的应用范围比“仅”社会科学的应用范围广,因为所涉及的技术已在许多领域使用。
很早以前,所以也许未涵盖在问题中,所以向我介绍了Ott的《统计方法和数据分析简介》。它相当昂贵,但是对于展示各种GLM方法的基础统计模型而言,它是一个很好的资源。我梦想有一天期刊要求文章包含显示测试统计模型的公式。
为了检查测试假设,查看测试中各种选项的效果等等,这是我在学习时希望拥有的一本书。我拥有以前的版本,并且它是我购买的最好的一般资源之一,因为它以清晰一致的方式来布置有关测试的信息。它包含说明测试的很好的示例,并且不需要读者具有特定的统计信息包即可遵循这些说明。
Taleb 愚弄随机
Taleb是哥伦比亚大学的教授和期权交易者。他在2008年押注该市场,赚了约8亿美元。他还写了《黑天鹅》。他讨论了使用正态分布来建模市场的荒谬性,并对我们使用归纳法的能力进行了哲学思考。
如果您有兴趣,我已经在Amazon和http://www.integrativestatistics.com/favorites.htm上进行了评论。
我已经阅读了上述建议,并惊讶地发现,回答问题的大多数人本身都不是统计学家。除了2或3个例外...作为一位工业统计学家,他也恰好与社会科学家和卫生专业人员一起工作,我会说,如果我只能将一本书随身带到荒岛,那就是实验者统计资料( George EP Box)(威利)。他以独特的幽默和清晰的风格解释了为真实数据建立数学模型的本质和哲学。严谨的思维,没有数学上的琐事,没有胡说八道,教会了我们进行统计思考,绘制和可视化任何可能的东西。一位称职的应用科学家的杰作(化学工程师转变为统计学家)。再次阅读总是很有趣。
赖斯:数理统计和数据分析
我从贝叶斯统计圣经中学到了很多东西:
“最有影响力的”概念与“每个人都应该阅读”完全不同。我没有资格回答第一个问题-您需要统计历史学家-但是第二个问题是:
罗伯特·阿伯森(Robert Abelson)提出的将统计学作为原则性论点的建议,应该是从事科学,人文科学等工作或使用统计学的任何人阅读的。
威廉·S·克利夫兰(William S. Cleveland)的两本关于图形的书:图形数据和可视化数据的元素。对于统计学家,我将这些放在甚至是Tufte的作品之前,因为bot不值得,但因为a)克利夫兰写信给统计学家是他的预定读者,并且b)克利夫兰基于关于人们如何看图的实验数据提出了建议,而不是直觉。
John Tukey的探索性数据分析。它已经过时,但很有价值-您可以用铅笔,纸和大脑做很多事情(至少,如果您的大脑和图基一样好!)
可能是Gelman的贝叶斯数据分析或Python的深度学习。但这有点像将链霉素带到中世纪。当我开始我的职业生涯时,这些不是写的,那时候书中的很多东西本来就是个大新闻。每个人都应该知道的一些最有影响力的东西并不是一成不变的(也许应该如此,但是...)。