我一直在阅读Tukey的书“探索性数据分析”。该书于1977年编写,着重强调纸张/铅笔方法。是否有一个更“现代”的后继产品考虑到我们现在可以即时绘制大型数据集了?
我一直在阅读Tukey的书“探索性数据分析”。该书于1977年编写,着重强调纸张/铅笔方法。是否有一个更“现代”的后继产品考虑到我们现在可以即时绘制大型数据集了?
Answers:
最接近的是克利夫兰的可视化数据。这是关于探索性数据分析的,它是关于计算机生成的可视化的,它的意义深远,是经典之作。
好吧,它不是一个精确的副本,但是我在使用回归和多级/层次模型的 Gelman和Hill的数据分析中发现了大量有用的绘图建议(和R代码)
此外,他的博客通常充满有用的图形建议。
用于数据分析的交互式图形:我喜欢原理和示例。这本书的描述说,它“讨论探索性数据分析(EDA),以及交互式图形方法如何帮助获得见解并从数据集中产生新的问题和假设。”
哈德利·威克汉姆(Hadley Wickham)的ggplot2本书很有趣,因为它既教授图形语法,又教授如何使用ggplot2软件。
值得一提的是罗纳德·皮尔森(Ronald Pearson)在工程,科学和医学中的探索性数据。它的主要目标读者群似乎是不怕一点数学的科学家,他们希望他们知道更多的统计数据。这是一个很大的群体,在这里有一个很好的代表。这有点古怪和另类,但是它涵盖了很多领域,并且包含了许多明智的建议。从提供许多新想法的意义上来说,Tukey并没有被重新审视,但是即使您认为它有点错误,对学习还是有益的。
这本书似乎几乎没有引起人们的注意,很可能是因为它非常昂贵,显然不适合作为课程教材,并且仅以精装本提供。但是它是智能的,易读的,并且没有现代入门教科书的垃圾(基本练习的页面和页面,愚蠢的图标,快乐的年轻人的免费照片,繁琐的带有框的布局等等)。
同时互动性和动态图形数据分析:随着示例使用R和GGobi,库克和Swayne
这有两章可在网络上公开获得,它们描述了数据分析的过程以及处理缺失值的过程。安东尼·温温(Antony Unwin)即将出版一本新书。
另外还有几本好书可供阅读,分别是《美丽的可视化》和《美丽的数据》。这些都是经编辑的书,有使用地块探索数据的惊人示例,还有一些绝对令人震惊的章节。
另一本使用ggplot2的范例很好的书是Winston Chang的新书