在R中处理大数据集-教程,最佳实践等


11

我是R新手,需要对R中的大数据集进行各种分析。因此,在浏览此站点和其他地方时,在我看来,这里涉及许多深奥而鲜为人知的问题-例如何时使用哪个包,对数据进行哪些转换(不进行转换)等。

我只是想知道是否有一本书/教程/指南使所有这些事情变得神秘,并以系统的方式呈现信息?我更喜欢这样做,而不是四处寻找,并在线整理来自不同来源的信息。

提前致谢。



1
分享一些您想进行哪种分析以及数据看起来如何的示例可能会有所帮助。简单的统计数据,例如均值还是复杂的回归?一千行中有200个变量,或者四行变量和2000万行?
PaulHurleyuk 2011年

1
如果您有真正的“大型”数据集,则可能应该看一下关系数据库。起点可以是RNB附带的“ R数据导入/导出”手册,该手册也可以通过R网站的“手册”部分获得。

1
首先,重要的问题:您的意思是什么,您想做什么?
Fomite 2011年

Answers:


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.