您觉得哪些R包在日常工作中最有用?


28

重复线程: 我刚安装了R的最新版本。我应该获得哪些软件包?

您无法想象日常使用数据的R包是什么?请同时列出常规工具和特定工具。

更新:至于24.10.10 ggplot2似乎以7票成为赢家。

提到的不止一个的其他软件包是:

  • plyr -4
  • RODBCRMySQL-4
  • sqldf -3
  • lattice -2
  • zoo -2
  • Hmisc/rms -2
  • Rcurl -2
  • XML -2

谢谢大家的回答!


1
非常主观的问题:无法回答此问题,因此不适用于质量检查站点。
Egon Willighagen'7

3
应该是社区维基;有用的问题,但没有明确的答案。
Shane 2010年

2
@Shane:好点。感动。// @ Egon:的确是主观的。但是,如果答案来自有知识的人,那么我就不会介意主观。我是最近才开始学习R的,并且已经安装了数十个R来进行探索,但是我注意到,无论手头有什么任务,我都会更频繁地使用一些工具。
radek

如果StackExchange能支持某种跨站点链接社区Wiki帖子的方法,那将很有趣。因为我敢打赌,这个问题已经在Stackoverflow上问了,而且我还认为统计分析可能会吸引一些通常不会访问SO的人。
Sharpie

@Sharpie:有很多有趣的SO帖子,例如stackoverflow.com/questions/1295955/…stackoverflow.com/questions/1535021/…,但是它们并不专注于软件包。我同意,社区Wiki的链接可能非常有用。
radek

Answers:






8

ggplot2-传授 R的最佳可视化效果。

RMySQL / RSQLite / RODBC-用于连接数据库

sqldf-使用SQL查询操作data.frames

Hmisc / rms -Frank Harrell的软件包,其中包含方便的其他功能和用于回归分析的出色功能。

GenABEL-用于全基因组关联研究的好软件包

Rcmdr-如果需要R的体面GUI。

另请参阅CRANtastic-此链接包含最受欢迎的R包的列表。列表顶部的许多内容已被提及


8

data.table现在是我的最爱!非常期待带有更多愿望清单的新版本。



6

就我个人而言,我最多使用以下三个软件包,这些软件包均可从令人敬畏的Omega统计计算项目中获得(我并没有声称自己是专家,但就我的目的而言,它们非常易于使用):

  • RCurl:它具有许多选项,可以访问基本R中的默认功能难以理解的网站,我认为这很公平。它是libcurl库的R接口,它具有R开发之外的整个社区的额外好处。也可在CRAN上使用

  • XML:解析格式错误的XML / HTML是非常宽容的。它是libxml2库的R接口,并且再次具有开发R之外的整个社区的额外好处,也可以在CRAN上获得

  • RJSONIO:它允许解析从json调用返回的文本并将其组织成列表结构以进行进一步的分析。此包的竞争对手是rjson,但是它具有矢量化的优点,可以通过S3 / S4轻松扩展,而且速度很快并可以扩展到大数据。

6

通过Sweave,您可以将R代码嵌入LaTeX文档中。执行代码以及源代码的结果将成为最终文档的一部分。

因此,除了将R生成的图像粘贴到LaTeX文件中之外,您还可以将R 代码粘贴到文件中并将所有内容放在一个位置。


4
对于所有想开始使用R进行可重复研究的人来说,这只是一个提示。我建议您先看看最新的软件包,knitr而不是Sweave。基本上是在类固醇上编织。它既简单又容易学习,而且更加灵活。
Christoph_J


4

我发现晶格与同伴一起书“莱迪思:多元数据的可视化与R”由Deepayan萨卡无价的。


4

如果您要进行任何类型的预测建模,则插入符号是天赐之物。尤其是与多核软件包结合使用时,可能会出现一些令人惊奇的事情。


4

每天最有用的软件包必须是“外国”软件包,该软件包具有读取和写入其他统计软件包(例如Stata,SPSS,Minitab,SAS等)的数据的功能。在R并不常见的领域中工作意味着是一个非常重要的包裹。


3

我用

汽车,doBy,Epi,ggplot2,gregmisc(gdata,gmodel,gplots,gtools),Hmisc,plyr,RCurl,RDCOMClient,重塑,RODBC,TeachingDemos,XML。

很多。


3

我不能没有:

  • 图形
  • xlsxXLConnect用于读取Excel文件
  • rtf以rtf格式创建报告(我希望使用SwordR2wd,但无法在工作中安装statconn;我一定会尽快尝试odfWeave。)
  • nlmelme4用于混合模型
  • ff用于大型阵列

2

RODBC用于访问数据库中的数据,sqldf用于在数据帧上执行简单的SQL查询(尽管我强迫自己使用本机R命令),以及ggplot2plyr



2

我们主要使用:

  • ggplot-用于图表
  • 统计资料
  • e1071-用于SVM

您可能还需要检出SVM的kernlab和插入符。它们是有趣的(不一定更好)。
扎克(Zach)


2

对我来说,我正在使用kernlab进行基于内核的机器学习实验室,并使用e1071进行SVM和ggplot2进行图形处理





2

当我需要快速for循环或执行非R兼容的处理时,我是RCPP的忠实拥护者。它在R eco系统中很好地实现,可以接收Matrix /稀疏Matrix,而无需将其作为函数中的参数进行转换。

当您做简单的事情时(通常是我的情况),C ++语法很容易。

确实,您不需要成为软件包制造商就可以使用此出色的lib。

我是说C ++非常快吗?


2

doParallel的foreach软件包允许我并行我的代码并在计算优化的情况下运行它使我的生活变得更轻松亚马逊EC2!我经常使用它们。但是,如果没有Louis Aslett发布的RStudio AMI,那将是不可能的。最后,我不得不提到stringer软件包,它确实使在公园里散步的弦乐工作更加轻松。在每个文本挖掘应用程序中使用它。而且我还经常使用knitr来生成高质量的工作报告。非常感谢您提供的这一令人惊叹的套餐!


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.