统计图形是否有“你好,世界”?


25

在计算机编程中,有一个经典的第一个程序用于学习/教学一种新的语言或系统,称为“你好,世界”。 http://en.wikipedia.org/wiki/Hello_world_program

使用绘图程序包是否有经典的首次数据可视化?如果是这样,那是什么?如果没有,那么好的候选人将是什么?


3
欢迎来到我们的网站!我们的常见问题确实要求“您只应根据自己面临的实际问题提出切实可行的问题”。您能否详细说明您的实际问题是什么?
whuber

3
我想确定统计图形的“标准测试项目”(如果有的话),将其包括在我正在开发的培训材料中。
亚伯拉罕·D·弗拉克斯曼

2
由于图形应用程序的变化如此之大,因此很难设想一些标准或通用图形。这里一些标准,对某些类型的图形包的,比如历史上著名的兔子和茶壶的3D图形。为了使您的问题能够得到回答,可以更详细地说明您的培训材料将涵盖哪些软件包。
ub

1
好点,谢谢。我将至少包括有关R,STATA,Python和Javascript中的统计图形的内容。
亚伯拉罕·D·弗拉克斯曼

@AbrahamDFlaxman我对这种“培训材料”以及其目的和目的感到好奇。你能说更多吗?
彼得·弗洛姆

Answers:


9

两个想法:

答:当我试图了解“ Hello World”的本质时,这是在编程语言中生成生成单行文本的有效程序所必须执行的最低要求。这向我暗示您的“ Hello World”应该是单变量数据集,这是您可以插入统计或图形程序的最基本的东西。

B.我没有发现任何关于“ Hello World”的图形。我能找到的最接近的是各种统计软件包中所包含的典型数据集,例如R的AirPassengers。在R中,Hello World图形语句为:

plot (AirPassengers)  # Base graphics, prints line graph

要么

qplot (AirPassengers) # ggplot2, prints a bar chart

要么

xyplot (AirPassengers) # lattice, which doesn't have a generic plot

就我个人而言,我认为最简单的图是线形图,其中Y和X的N个项的范围为1:N。但这不是标准。


1
从这个答案和其他答案得出的共识是,目前没有统计图形的“世界,你好”。我认为您关于单变量数据集的建议令人信服,Y和X中的N个项的范围为1:N。进一步类似于“ hello,world”,拥有一个小的N和令人难忘的Y会很好。您如何看待N = 5和Y =(3,1,4,1,5,9)(即pi的位数?也许那太数学了。
亚伯拉罕·弗拉克斯曼

1
@AbrahamDFlaxman:我不认为这很数学,我认为那很棒。令人难忘,简短,图表不只是一条直线或其他任何东西。数据是众所周知的,并且不受任何特定程序的约束,任何想要获得更多分数的人都可以任意扩展数据。我投票!
韦恩

24

我可能会从散点图开始,并演示这四个丑陋的关联


2
+1。但是您可能需要考虑一些更通用的东西,例如某种形式的折线图。毕竟,只要您可以绘制线段,就可以绘制任何东西。这呼应了“ Hello,world!”的想法:一旦您可以从程序中获得可读的输出,便知道可以与计算机进行通信了,其余仅是细节:-)。(细节可能很难理解。在学习为IBM 360大型机编写汇编代码时,获取输出的最简单方法是将其存储在RAM中,并在执行结束时产生错误,从而导致系统打印十六进制核心转储。 !)
ub

我认为Anscombe的四重奏总共包含太多内容,无法用作统计图形的“世界,你好”,但是他论文中的图1可能是不错的选择。其他答案也为单变量数据集提供了条件,但是我倾向于。
亚伯拉罕·D·弗拉克斯曼


5

我认为答案是“否”。也就是说,您的问题没有得到普遍认可的答案。

@StasK指向散点图。

不过,我会考虑什么样plot的呢R:这取决于数据!

您可能会说单变量统计比双变量统计更简单。所以...也许最基本的东西是直方图;或条形图;也许是密度图。

如果说“你好,世界!” 是为了表明您可以让计算机做某事,然后我说任何情节都可以。


1
也许没有标准的测试项目表明您是正确的,并且更适合使用所演示系统中最简单的绘图。但是,这很难比较。
亚伯拉罕·D·弗拉克斯曼

5

不确定它是否完全符合打招呼的条件,但是在R中,很多软件包中都内置了演示。例如

library(graphics)
demo(graphics)

将引导用户逐步了解软件包中提供的一些基本图形。只需在每个图像上单击鼠标,即可逐步浏览基本图形插图。仅用两行,就向用户介绍了R图形进行统计的一些启发性功能。

R控制台中显示用于生成图形的相应代码。

在此处输入图片说明


2

我想说有两个用于数据可视化的“ Hello World”类型程序:

Print(“ Hello World”):类似于正态分布变量的直方图,或者简单的X,Y散点图。

对于稍微复杂一些的内容,例如本节中介绍“ Hello World”原理并开始使用用户输入,转义字符等的内容,我想说的是它将与Iris数据集一起使用。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.