有关R的统计资料参考书-是否存在,并且应包含什么?


25

背景

围绕此问题进行了很多讨论,因此我认为我可以从StackExchange的早期版本以及通过疯狂地搜索来找到答案。经过半天的尝试,我只为R找到了一本关于(生物)统计的参考书,但我完全感到困惑,不得不放弃。也许免费材料的组合实际上比您现在可以购买的任何书都要好。让我们找出答案。

互联网上充斥着许多不错的R语言免费文学作品,因此,平庸的书实在是没有意义的,因为平庸的书大部分时间都被用作办公装饰。R主页站点列出了与R相关的书籍,其中有很多。更准确地说:115.其中只有一个广告标有“ 独立统计参考书 ”。现在已经8岁了,可能已经过时了。带S的《现代应用统计》的第四版甚至更旧。R书经常被认为过于基础,因此不推荐使用,因为缺乏参考,格式不良的代码和草率的处理。

但是,我正在寻找一本书,该书可以用作对带有R(第二)的实用统计(第一和第一)的独立参考。这本书应该放在我的办公室桌上,收集注解,咖啡渍和油腻的指纹,而不是书架上的灰尘。它应该取代我到目前为止一直在使用的免费pdf集合,不要忘记R带有出色的参考库。“ 正确的方法是什么?”,“ 为什么?“和‘ 在技术上,它是如何工作的? ’往往更迫切问题不是‘ 怎么有R办呢? ’

由于我是生态学家,所以我对生物统计学的应用最感兴趣。但是,由于这些东西经常联系在一起,因此跨学科的一般性参考对我来说将是最有价值的。

任务

如果存在这样的书(我对此表示怀疑),请提供该书的名称(每个答案仅一个),并简要介绍该书,以解释为什么应将其命名为该主题的参考书。由于此问题与现有问题并没有太大不同,请使用此提示进行回答。您还可以列出书中的缺陷,以便我们将其列为理想参考书的功能。

我的问题是带有R的(最常用的)统计参考书应包含哪些内容?

一些初步的想法是遵循以下一般功能(请更新):

  • 蠢如顽石
  • 简洁但可以理解
  • 填满数字(提供R代码)
  • 易于理解的表格和图表描述了文本中最重要的细节
  • 易于理解的有关统计/方法的描述性文字,其中包含最重要的方程式。
  • 每种方法的良好示例(带有R代码)
  • 广泛而最新的参考文献清单
  • 最少错别字

目录

由于我不是统计学家,因此需要此书(不存在吗?)来回答这个问题,因此我很难写出内容。因为R书显然打算成为R的统计参考书,但经常遭到批评,所以我从书中复制了目录,以此作为独立R统计参考书的目录的起点。附加任务:请为目录提供补充,建议,删除等。

  1. 入门
  2. R语言基础
  3. 数据输入
  4. 数据框
  5. 图形
  6. 桌子
  7. 数学
  8. 古典测验
  9. 统计建模
  10. 回归
  11. 方差分析
  12. 协方差分析
  13. 广义线性模型
  14. 计数数据
  15. 表中数据计数
  16. 比例数据
  17. 二进制响应变量
  18. 广义加性模型
  19. 混合效应模型
  20. 非线性回归
  21. 树模型
  22. 时间序列分析
  23. 多元统计
  24. 空间统计
  25. 生存分析
  26. 仿真模型
  27. 改变图形外观
  28. 参考资料和进一步阅读
  29. 指数

刚才说了什么?

StackExhange包含几个方面,可询问统计数据和R书建议。学习R语言的书籍询问有关没有统计方面学习R语言的参考书。R编程的艺术被评为最佳单一建议。使用R进行书本统计学习,需要一本理想的统计入门书,这与参考书确实不是一回事。开源统计教科书行列多元统计有R作为最佳替代品。您会为非统计学家的科学家推荐哪本书?在没有指定选择程序的情况下询问最佳统计参考书。参考或关于R得分的实验设计数据仿真的书可能与我的问题最接近。这里最推荐使用R进行科学编程和仿真入门,并且可能与我正在寻找的内容接近。但是,这本书不足以作为使用R进行统计的参考书。

对参考书的一些建议及其缺陷

与《 R书》相比,《 R in Action》获得了更好的评论,但显然是介绍性的

使用R进行生物统计设计和分析:实用指南可能与我正在寻找的指南接近。它得到了很好的评价,但显然这也包含许多错别字。此外,这本书不专注于解释统计,而是将统计分析作为现成的配方提供给研究人员使用。

R中的生态模型和数据会跳过入门级。这是一个非常有用的功能,因为看到“介绍”一词在R书列表出现次数为43 ,但如果我们追求统计学的参考书,也许并不完全令人满意……?

使用R进行科学编程和模拟入门受到了非常积极的评价,但仅限于数据模拟。

Richiemorrisroe表明,现代应用统计带有S是足以与R.这本书一个独立的统计工具书已获得极高的评价(12),并可能为标题在当下的最佳人选?最新版本是10年前发布的,考虑到程序开发,这已经是相当长的时间了。

Dimitriy V. Masterov建议使用回归和多层次/层次模型进行数据分析。尚未检查过这本书。


在阅读了很多书评后,看来这里所问的完美书还不存在。但是,也许可以选择非常接近的一个。此踏步旨在作为社区Wiki,供统计用户查找现有的最佳参考书,以及激励新书和旧书作者改善工作。


3
(+1)的好评!但是,看来您已经在自己的问题内回答了自己的问题……
ocram 2012年

1
如果您花了很多时间来解决这个问题,那么拿出一长串自己的书,甚至是一本此类书的提纲,也许您应该写一本。当有人要求获得有关[BLAH]的优质评论论文并讨论他们对现有的五,十篇评论论文不满意时,我经常在统计和计量经济学列表中提出此建议。
StasK 2012年

Answers:


12

我个人认为带有S-Plus的Modern Applied Statistics勾勒了您所概述的所有方框。每个示例都有R代码,它们很好地引用了其他资料,Venables和Ripley具有精妙而简洁的解释风格,我对此表示赞赏。我倾向于每隔一段时间,以及每次从中获得更多收益时,都会重新阅读这本书。当然,您的里程可能会有所不同。


2
我同意。我有很多基于R的统计书,而MASS4可能是您所寻找的最接近的书,但是在某些地方,“简洁”变得难以理解,并且比我拥有的大多数统计背景知识都需要。就是说,我拥有这本书将近10年了,我会继续学习并学习新知识。我不会让它的年龄拖延你的。哦,我现在正在做统计博士学位:-)
肖恩(Sean)

我也反复回到MASS,这听起来像是对它作为参考书的偏爱。
彼得·埃利斯

1998年版本的MASS与2003年相比有何不同?想知道内容差异是否足以为它多掏出50英镑。
推测

6

感谢您提出这样一个好问题,尤其是整理所有这些信息。不幸的是,您所描述的书不存在,老实说,它不可能存在。如果您主要想要的是统计参考书,那么我将从一本非常好的线性模型书开始。我的建议是库特纳等人,它在体积和质量上都符合大于砖的标准,非常全面,清晰,并带有许多示例。实际上,如果您取消了R要求,则几乎可以剔除整个列表。我经常提到它。但是,在大约1500页中,它几乎只涵盖线性模型(即回归和ANOVA),其中有一些简短的章节涉及其他几个主题,但是您确实会需要其他书籍。接下来,我将获得最适合您的水平的统计参考书,涉及您可能需要使用的其他任何技术(例如,生存分析,空间分析等)。如果这些书不使用R作为示例,则您可能希望获得R特定的书,例如use-R之一!书籍,但在文档,插页,R帮助邮件列表之间,您可能不需要StackOverflow和CV。如果您想学习用正确的方法进行R编程,那么您也应该获得其中的一本书。此时,您至少有4本书。对不起,事实就是这样。没有一个专门从事统计工作的人能写一本涵盖所有内容的书。


5

我认为不存在像这样的书。我认为最接近的书是Gelman和Hill的《使用回归和多层次/层次模型进行数据分析》

缺点:

  • 大约5岁了,针对社会科学家。

  • 它在您的目录列表中没有所有内容(没有空间,基本上没有时间序列等)。

优点:

  • 写得好

  • 链接上有勘误表和目录

  • 它涵盖了诸如丢失数据之类的关键内容,这些数据不在您的编号列表中。

  • 它确实击中了项目符号列表上的大多数项目。

  • 很多图和R代码(一些用于多层的Bug代码)。

  • 所有数据/代码均可下载。


4

我正在通过统计学习要素进行工作。本书涵盖了令人难以置信的技术范围(超过700页),但是每种方法都以非常实用而不是高度理论化的方式进行了清晰的解释。它没有明确包含有关R的任何内容,但是使用R清楚地绘制了图和图,并且在CRAN上提供了用于所有讨论主题的软件包。作者都参与了R(以及相当一部分现代机器学习技术)的开发。


2
那本书甚至有一个R包:ElemStatLearn :-)
chl

3

我同意目前最受好评的答案,即MASS4非常适合该请求,并且与另一位受访者具有相同的经验,但难以满足其相当高的统计水平要求。实际上,MASS3是我的第一本“ Rbook”,并且以这种身份为我提供了很好的服务。我确实购买了克劳利(Crawley)的《 The R Book》,但由于对R语言的描述不准确,以及仅是一些似乎缺乏统计学理论深度的实际例子而感到不满意。

但是,随着时间的流逝,我发现Harrell的“回归建模策略”(RMS)更适合此问题的“生物统计学”重点,并且具有很好的深度。它不是R的介绍性文本。为此,我需要查找其他地方,为此,我推荐使用R进行科学编程和模拟入门[ http://www.crcpress.com/product/isbn/9781420068726]或(尽管它的名称)“ R for Dummies”(由R代表傻瓜),由长期撰写给StackOverflow的R发布标签的一些人撰写。我只在RMS的第一版中更关注S,但是从那时起Harrell切换到R并完全支持Rrms/HmiscR包二重奏。我相信它可以满足@gung关于在列出的几个领域中进行专业报道的建议,尽管不适用于空间分析或混合模型。


1
我强烈建议RMS和MASS。我不从事生物统计学工作,但是Harrell中的大多数建议都更有用。我经常要求有前瞻性研究的学生阅读Harrell,或者至少阅读第4章,然后经常推荐MASS作为一本好书,以确保他们熟悉。
Glen_b-恢复莫妮卡

对于一般的自学,我提名Cox和Hinkleys的“理论统计”和Feller的2卷“概率论概论”。但这显然不能解决这个问题的R部分。
DWin

[我指导的学生不在统计学领域,尽管他们的工作涉及很多……与Cox和Hinkley和Feller Vol 2相比,MASS和RMS对他们有更多帮助,尽管两者-肯德尔(Kendall)和斯图尔特(Stuart)–对我的背景非常有价值]
Glen_b-恢复莫妮卡(Monica

2

如果您想翻译...(这是一本4,900页理论书籍的随书):

大R书

本书(我是其中的合著者)汇集了15年的本科和研究生水平的咨询经验和教学,并且仅显示了我的4,900页中提供了其数学(证明)详细信息的R语言示例。随书,也可以使用数值手动进行计算(+500页,下一版将提供)。本书还提供了检查软件是否提供正确值的可能性,这比手动或在MS Excel中对通常在欧洲学校研究生课程中教授的主题进行计算要有趣得多。本书的目的还在于说明您可以免费使用1个软件代替许多软件,而无需花费任何成本即可获得相同的结果(而不是同时使用JMP + Minitab + SPSS + SAS + MATLAB)。本书还显示了R的弱点(无法保证软件包的维护)。它也是各种R论坛和博客上非常有价值的问题的纲要。它是免费的并且有颜色!


1
您还可以提供所要求的“简短评论”吗?您为什么推荐这本书?关于它的好(坏)是什么?

我是共同委托人之一...简短评论不是很中立...
Vincent ISOZ

1
没关系-我们将很高兴听到您的意见,您认为这是您书的优点或对谁会受益的表征。通过公开您与书的联系(这是必不可少的),您可以使读者在评估您的言论时考虑到这一点。我怀疑许多读者会理解您对这本书非常了解,并且会赞赏您的发言。如果不提供某种评论,您的答案将只能降为仅引起相对较少关注的评论。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.