Tukey探索性数据分析的现代继任者?


52

我一直在阅读Tukey的书“探索性数据分析”。该书于1977年编写,着重强调纸张/铅笔方法。是否有一个更“现代”的后继产品考虑到我们现在可以即时绘制大型数据集了?


这应该是社区Wiki吗?
richiemorrisroe'2

我不清楚这是否应该是CW。可能没有好的答案。可能会有一个明确的突出答案;我们可能会生成一长串有效答案。让我们看看发生了什么。
ub

4
这是一个很好的问题,生物冰箱。我只想指出,这与其他工作方法非常相似。我最喜欢的是,笔和纸的EDA适用于现代统计数据,而手工工具适用于现代木工。(“现代”木工使用了许多电动工具,例如台锯和router刨机,即使是初学者也可以在更短的时间内获得可接受的结果。但是,这些工具每年还造成成千上万的手指和四肢缺失。学习使用手动工具的人们通常,即使使用电动工具也能学会更好地工作。)
whuber

4
是的,木工是一个很好的类比(缺少数字,缺少数字)。另请参阅software-carpentry.org
denis 2012年

Answers:






4

值得一提的是罗纳德·皮尔森(Ronald Pearson)在工程,科学和医学中探索性数据。它的主要目标读者群似乎是不怕一点数学的科学家,他们希望他们知道更多的统计数据。这是一个很大的群体,在这里有一个很好的代表。这有点古怪和另类,但是它涵盖了很多领域,并且包含了许多明智的建议。从提供许多新想法的意义上来说,Tukey并没有被重新审视,但是即使您认为它有点错误,对学习还是有益的。

这本书似乎几乎没有引起人们的注意,很可能是因为它非常昂贵,显然不适合作为课程教材,并且仅以精装本提供。但是它是智能的,易读的,并且没有现代入门教科书的垃圾(基本练习的页面和页面,愚蠢的图标,快乐的年轻人的免费照片,繁琐的带有框的布局等等)。



0

另外还有几本好书可供阅读,分别是《美丽的可视化》和《美丽的数据》。这些都是经编辑的书,有使用地块探索数据的惊人示例,还有一些绝对令人震惊的章节。

另一本使用ggplot2的范例很好的书是Winston Chang的新书


1
迪,我只是想仔细检查一下,以防出现细微的错别字:您也许是想写“吸引人”而不是“令人震惊”?尽管两者都在这种情况下有意义,但后者的出现(没有任何进一步的解释)实在令人惊讶!
ub

2
骇人听闻是正确的-杂乱无章-编辑的内容经常是
Dianne Cook

我对这些建议感到惊讶。我发现这两本书都令人失望(长篇大论,图形短)。不幸的是,我最初以出色的Unix书籍的发行者身份遇到的O'Reilly,似乎对甚至是远程统计的任何书籍的质量控制都非常不均衡。
尼克·考克斯

我喜欢这两本书,真的觉得它们是实质性的贡献。Winston Chang在使用ggplot2进行绘图方面有很多基本细节。这是一个很好的初学者参考。它并不能告诉您为什么要进行这些绘图,但是从我阅读的文章中,大多数内容对于目的来说是很有意义的。“美丽的可视化”中有一些非常令人印象深刻的章节,解决了诸如可视化维基百科,海量数据,许多复杂性之类的难题,并且贯穿了进行绘图的思维过程/决定。
黛安·库克

以防万一我的评论模棱两可:我指的是“美丽”的书。Winston Chang的书很好而且很有帮助。
尼克·考克斯

0

我认为将Hoaglin,Mosteller和Tukey理解的鲁棒性和探索性分析作为EDA的技术后续工作,是探索数据表和形状的配套书。我还看到数据分析和回归,这是Mosteller和Tukey开设的第二门统计学课程,是EDA的后续课程。上面提到的各种克利夫兰书籍都是宝藏。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.