学习用于创建数据可视化的资源?


19

我对学习如何创建您在http://flowingdata.com上看到的可视化类型感兴趣,并且信息很漂亮。编辑:意思是,可视化本身很有趣-有点像《纽约时报》的图形,而不是快速的报表。

用于创建这些工具的工具有哪些-大多数是Adobe Illustrator / Photoshop吗?有什么好的资源(书籍,网站等)来学习如何使用这些工具进行数据可视化?

我知道什么我想可视化来的样子(我熟悉的设计原则,例如,从塔夫特的书),但我不知道如何来创建它们。

Answers:


20

流动数据会定期讨论他使用的工具。例如,请参阅:

他还非常详细地展示了他有时如何制作图形,例如:

此网站上还有其他问题:

IMO,请尝试:

  1. R和ggplot2:这是一个不错的入门视频,但是ggplot2网站上有很多资源。
  2. 处理:主页上有很多不错的教程
  3. Protovis:主页上还有很多很棒的例子

之后,您可以使用Adobe清理它们。

您还可以查看R webvis软件包,尽管它不如ggplot2。在R中,您可以运行以下命令以查看Playfair的Wheat示例:

install.packages("webvis")
library(webvis)
demo("playfairs.wheat")

最后,我最喜欢的交互式可视化商业应用程序是:


1
很棒,很棒的链接!我已经使用过R和ggplot2,但是从那里看的可视化似乎更多的是“报告的图形” —而不是我在寻找的“本身有趣的视觉效果/可视化”。(ggplot2非常漂亮,但这并不是真的意味着无限的创造力。)我是对的吗?还是您有时将R / ggplot2用作另一个可视化工具的输入?
raegtin

5

已经提到处理过程中有很多可用的书籍。看到:1234567

在Web上您会发现很多东西可以帮助您从R开始。下一步,ggplot2将提供出色的Web 文档。我还发现哈德利的很有帮助。

Python可能是另一种方法。特别是使用以下工具:

所有项目在网络上都有详细记录。您可能还考虑偷看一些

最后,《大数据集图形》一书也可能有所帮助。


igraph也可以在R中工作;适用于R,使用rglmisc3d包装中的3D openGL加速vis 。

此外matplotlib地块是丑陋的; 对于长期使用gnuplot的用户来说,它们可能很好。

2

您将花费大量时间来适应R。

RapidMiner是免费,开放源代码和图形的,并且具有大量良好的可视化效果,您可以导出它们。

如果您有足够的钱或者是大学的工作人员/学生,那么JMP也非常不错。它可以非常轻松地制作一些非常漂亮的图形。可以导出为Flash或PNG或PDF或您拥有的文件。


5
1.如果您打算做任何认真的事情,那么与R在一起的恕我直言,时间就是很好的投资。2.还可以将KNIME knime.org视为RapidMiner的替代方案。
radek 2010年

(+1)@radek。我还是一名急速爱好者,但我认为它不够灵活,无法进行复杂的可视化。
steffen 2011年

如果您有任何编码经验,那么您真正地不需要超过一天的时间就能熟悉R。就语言而言,这非常简单,并且有一些出色的在线教程。
naught101

1

另一个不错的替代方法是protovis库http://vis.stanford.edu/protovis/

如果您有时间和能力编写所需的少量JavaScript代码,那么它是一个精心制作的JavaScript库,可以创建一些漂亮的可视化对象。

我也强烈推荐Tableau http://www.tableausoftware.com。它非常适合快速浏览数据集并创建许多不同的可视化文件。

两种产品都源于斯坦福视觉化集团。


1

这里给出了许多出色的答案,您选择学习的语言/库将取决于您想要进行的可视化类型。

但是,如果您定期使用Python,则强烈建议使用seaborn。在统计数据可视化方面,它非常复杂,但从演示的角度来看,它也非常复杂。

让我们举个例子。假设您正在尝试按月绘制商业建筑的用电量。为此,可以在matplotlib中生成一个简单的折线图。

但是,如果我们想使可视化更加复杂和信息丰富,则可以生成带有seaborn的热图:

热图

热图只是一个示例。seaborn的其他一些常见用法包括:

  • KDE图
  • 群图
  • 小提琴情节

seaborn的想法是,以比使用更简单的图表(例如折线图,条形图,饼图等)更直观的方式呈现数据。

如果您感兴趣-您可以在此处找到有关seaborn的更多信息:https ://seaborn.pydata.org/



0

R很棒,但这并不是R很难学习的原因,它是文档无法搜索任何其他名称,例如Rq会很棒。因此,当您遇到问题时,寻找解决方案就是一场噩梦,文档也不是很好。Matlab或Octave会很棒。而要在R或Matlab中获得这些图将非常繁琐。

恕我直言,后期处理视觉效果是最佳途径。许多来自流动数据的数据都通过Adobe Illustrator或Gimp放置。它更快。获得图的结构后,请在编辑器中更改详细信息。使用R作为编辑器不会给您所需的灵活性。您会发现自己一直在寻找新软件包。


R; function??-R有内置帮助。您通常还可以搜索“ cran”以找到R的东西,而且我发现大多数主要的搜索引擎都能很好地处理单个字母。
naught101



By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.