本书提供了统计方法的广泛而概念性的概述


12

我对统计分析在模拟/预测/功能估计等方面的潜力非常感兴趣。

但是,我对此并不太了解,我的数学知识仍然非常有限-我是软件工程专业的一名本科生。

我正在寻找一本可以让我开始不断学习的东西的书:线性回归和其他类型的回归,贝叶斯方法,蒙特卡洛方法,机器学习等。我也想开始使用R,所以如果有一本书将两者结合在一起,真是太棒了。

最好是,我希望这本书从概念上而不是过多的技术细节上进行解释-我希望统计数据对我来说非常直观,因为我知道统计数据存在很多风险。

我当然愿意阅读更多书籍,以增进对我认为有价值的主题的理解。

Answers:


11
  • 也许您想要像使用R的数据分析和图形之类的东西 John Maindonald和W. John Braun 的基于示例的方法

    • 图书网站
    • 带有各种评论的亚马逊
    • 我之所以推荐它,是因为这本书打了几个字;它教了一点R;它概述了各种不同的建模技术(例如,多元回归,时间序列,图形,广义线性模型等),而无需过多地介绍数学细节;它是相当适用的。
  • 我同意@Greg Snow的看法,认为您最好阅读一些不同的书。对于您提到的每个主题(例如,贝叶斯统计,时间序列,模拟,R,机器学习),都有针对该特定主题的好书。考虑到您对该主题的特殊兴趣,您不妨问一遍关于什么是一本好书的问题。

  • 良好的免费在线选择

    • 《统计学习的元素》是一本非常好的书,甚至可以免费在线获得。从您的帖子中,我感觉到它可能比起初想要的要多一些技术,但是请检查一下并看看您的想法。也许您现在就准备好了;也许以后。
    • Benjamin Bolker 在R中生态模型和数据是另一个很好的例子。它是从生态学的角度出发,但确实从相对非技术的角度清楚地解释了仿真和模型拟合。并且全部在R中实现。您可以在网站上查看其所有R代码。您甚至可以看到用于生成书籍的Sweave文档!
    • 在CRAN上有很多不错的免费R文档,其中一些文档还提供了更广泛的统计信息。

5

一本包含所有这些主题的书会给人留下深刻的印象,并且可能比您重。这就像要求一本书在同一本书中教授基础编程,C,Java,Perl和高级数据库设计(实际上可能更多,但我不知道有足够的软件来增强术语以在其中添加一些更高级的术语) 。

回归本身通常至少是一门完整的大学课程,贝叶斯统计学需要一门或一门理论课程,然后才能完全理解贝叶斯课程,等等。

没有捷径可走。我建议在您的大学修读一些不错的课程,然后从那里开始工作。

您还可以对其他好书进行讨论,以期获得一些想法。


谢谢您的回答。但是,我并不想从一本书了解有关的一切的一切,但阅读比方说,约50个回归页面肯定会帮助我很多,至少让这个问题的一些合理的理解...
杰罗姆勒沙特列

5

对于R与您描述的许多方法的结合,除了@Jeromy Anglim提到的Maindonald和Braun文本外,我建议您看看朱利安·法拉维(Julian Faraway)的这两本书:

两者都对各个主题进行了相当简单的介绍,后者涵盖了许多更现代的回归方法,其中包括许多机器学习技术,但是这样做的速度更快,描述更少,并且都通过R代码举例说明了这些技术。

如果您直接从Chapman&Hall / CRC Press购买,您可以从R网站的书籍部分获得代码,以使您的RRP享有20%的折扣,但是请务必查看您所在地区的亚马逊价格或类似价格,因为通常亚马逊的降价具有竞争力加上折扣后的发行商价格。

这对书籍的优点之一是,它们为您提供了足够详细的现代方法风味,然后您可以使用更专业的文本来进一步探索您想要的领域。

这些书籍中的某些内容可以通过Julian 的R网站在线“ 贡献的文档”部分以在线PDF格式获得。我鼓励您浏览该部分,以查看是否有其他文档可以帮助您入门而不必花很多钱。在本节中也可以找到早期版本的文本,该文本已成为Maindonald和Braun的第一版。


3

好吧,如果您想对大多数统计方法以及它们的R代码进行概述,那么使用Venables和S中的Ripley的Modern Applied Statistics不会出错。

它简洁明了,具有足够的R代码,可让您开始研究几乎所有您想提及的统计主题。

我买了这本书,对价格与页数保持警惕,但值得进行投资。它们确实假设有演算和线性代数,但是考虑到您是一名工程师,这应该不会有太大问题。

他们的S编程也很棒,但可能不是您现在正在寻找的东西。


2

对于初学者来说,统计学习的内容可能很少。我建议阅读“ R中的应用程序进行统计学习入门 ”,可以从此处免费下载-> http://www-bcf.usc.edu/~gareth/ISL/ 。在每一章的末尾。

史蒂芬·马斯兰德(Stephen Marsland)撰写的“ 机器学习:算法观点 ”也涵盖了更广泛的主题,而无需过多地关注数学。


1

前面的答案在应用程序方面有很多方面。就概念性材料和良好的统计思维而言,我将推荐《概率论:埃德温·杰恩斯(Edwin Jaynes)的科学逻辑》。前三章可在此处免费获得

但是,它与计算机程序的方式并没有很多关系,因此,应用程序方面的问题更多地放在风格化问题上。关于概率论的悖论,有出色的一章,其中一个例外是“边际化悖论”,在这里可以正确解决(尽管Jaynes本质上是“吸取了教训”,因为不适当的先验应该是一系列适当先验的限制) 。


2
我本人也喜欢这本书,但是我不确定这是开始尝试建立统计学直觉的地方。这是一个颇具争议性和特质的文本。
本·劳德代尔

1

到目前为止,所提出的建议都非常出色,但都集中在使用R软件的最先进和最先进的技术上。对于经典多元技术的出色而直观的概述,最新方法的基础框架包括回归,ANOVA,因子分析,聚类分析,判别分析,列联表分析和结构方程分析,Dillon和Goldstein的多元 Wiley在80年代发表的统计数据仍然是经典。它很清楚,并在示例中得到了应用,而又不过分地理论化或与软件结合。

我将Dillon和Goldstein推荐给任何想了解现代机器学习方法起源的人。



0

R Cookbook是跳入R并开始学习如何使用它的好方法。它非常实用,因此对于学习使用该语言非常有用,但是您也应该寻找一本好的理论书籍。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.