是否有不错的浏览器/查看器来查看R数据集(.rda文件)


38

我想浏览一个.rda文件(R数据集)。我知道该View(datasetname)命令。Mac附带的默认R.app没有很好的数据浏览器(它将在X11中打开一个窗口)。我喜欢用View命令打开的RStudio数据浏览器。但是,它仅显示1000行,而忽略其余的行。更新:RStudio查看器现在显示所有行)是否有一个不错的浏览器来显示数据集中的所有行以及您喜欢/使用的行。

Answers:


22

这里有一些基本的选择,但是像您一样,我不能说我对当前的系统完全满意。

避免使用查看器

  • 即,使用命令行工具浏览数据
  • headtail显示初始和最终行
  • str 有关变量类型的概述
  • dplyr::glimpse()有关所有列的变量类型的概述
  • 基本的提取工具喜欢[,1:5]显示前五个列
  • 使用寻呼机page(foo, "print")可能结合一些变量提取工具来显示和导航数据(例如)。在使用的Linux上,此方法效果很好less。我不确定它在Windows或Mac上如何运行。

导出到电子表格软件


(+1)通常我也导出到电子表格,有时edit(your_data_object)也很有用,尽管不确定此功能的行和列限制。
Dmitrij Celov 2011年

3
(+1)。Stata中的数据浏览器并不完美,但这是我在许多情况下启动Stata而不是R(Studio)的原因之一。
神父

1
在第二篇文章中,RExcel可以使R和Excel之间的数据传递更加无缝,尽管它仅在Windows上可用。我还没有尝试过(我不在Windows上);我基本上满足于write.csv :)
JMS

@Jeromy Pager在Mac上工作正常。
chl

2
@ Curious2learn:您是否打算认真查看700 Mb的数据?大部分由杰罗米(所给出的选项headtailstr等)应该足够了。如果你希望你的数据“大”的观点......绘制它(plotqqplothist等)
尼科

26

我强烈推荐R包googleVis,R绑定到Google Visualization API。软件包的作者是Markus Gesmann和Diego de Castillo。

googleVis中的数据框查看器非常简单易用。

这些人做的很棒,因为googleVis易于使用,尽管Google Visualization API却不然。

googleVis可从CRAN获得

在功能googleVis用于呈现数据帧作为风格HTML表格是gvisTable()

调用此函数,传入R数据框,将R数据框呈现为交互式 HTML表,其格式既具有仪表板质量又具有功能性。

我发现googleVis / gvisTable的一些功能特别好:

  • 当行数增加时,为了保持响应速度,用户指定的分页参数值(使用箭头按钮);如果您不希望分页,则可以根据gvisTable()函数调用中指定的参数,通过表右侧的滚动条访问视图外部的行

  • 通过单击列标题按列进行排序

  • gvisTable调用返回的HTML,所以它是可移植的,虽然我还没有使用此功能,整个表可样式,任何HTML表格样式的方式,用CSS(第一类分配到相关的选择)

要使用,只需导入googleVis包,调用gvisTable()传入数据框,然后将结果(是gvis对象)绑定到变量;然后在该gvis实例上调用plot

library(googleVis)

gvt = gvisTable(DF)

plot(gvt)

您也可以传入许多参数,尽管可以通过gvisTable的单个参数options来完成,options是R列表,例如,

gvt = gvisTable(DF, options=list(page='enable', height=300))

当然,您可以使用自己的CSS来获得所需的任何细粒度样式。

在gvis对象上调用plot时,将打开浏览器窗口,并使用Flash加载表格

:


3
对于中型到大型数据集,这似乎并不是很好。
扎克2012年

13

RStudio(RStudio.org)具有一个非常不错的内置数据框查看器。幸运的是,它是只读的。一旦安装了R的最新版本,RStudio的安装非常容易。如果使用Linux,请先安装r-base软件包。


2
是的,我喜欢RStudio中的查看器。但是,正如我在帖子中所说的,它仅显示前1000行。我可以通过更改某些设置来增加它吗?我尝试更改最大打印量,但这并没有影响数据查看器。
Curious2learn 2011年

@ Curious2learm:您应该要求他们在support.rstudio.org/help/discussions/suggestions上的下一个RStudio版本中添加此选项,他们通常会在2天内回答
RockScience 2011年

12

以下是一些其他想法(尽管我总是不愿离开Emacs):

  • 推导器(带有JGR)允许使用组合的变量/数据视图(如SPSS)查看data.frame。
  • 尽管在X11环境中,J Fox的Rcmdr也提供了编辑/查看功能。
  • J Verzani的Poor Man Gui(pmg)仅允许快速预览data.frame和其他R对象。对Rattle功能了解不多。

以下是使用Deducer(顶部)和Rcmdr(底部)查看704 x 348 data.frame(作为RData加载)时的两个屏幕截图。

在此处输入图片说明

在此处输入图片说明


9

可以View()中显示所有数据RStudio。诀窍是您需要改用命令语法utils::View()。(有关更多信息,请参见我对堆栈溢出的回答:R View()不会显示数据框的所有列。)


我使用utils :: View()函数编写了一个简单的函数,该函数还会向我显示列号并将其放在[Rprofile.site文件](statmethods.net/interface/customizing.html)中,以便将该函数加载到R启动。最好的部分是,行号和列名始终可见。下面是该函数的代码:view <- function(x){ numberColumns <- ncol(x) numbers <- seq(1, numberColumns) names <- names(x) names(x) <- paste0(numbers, "_", names) utils::View(x) }
elevendollar


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.