Answers:
AFAIK,不。更准确地说,我不知道有一个R包可以通过一个函数调用为您完成所谓的探索性数据分析(EDA)的一部分-我正在考虑重新表达和启示方面在Hoaglin,Mosteller和Tukey中讨论了了解稳健和探索性数据分析。Wiley-Interscience,尤其是1983年。
但是,R中存在一些不错的选择,尤其是在数据的交互式探索方面(请看这里有趣的讨论:交互式数据可视化何时有用?)。我能想到的
这仅用于交互式数据浏览,但是我想说这是EDA的本质。无论如何,上述技术在探索数值变量之间的双变量或高阶关系时可能会有所帮助。对于分类数据,vcd包是一个不错的选择(可视化表和汇总表)。然后,我要说的是,首先使用vegan和ade4软件包来探索混合数据类型的变量之间的关系。
最后,R中的数据挖掘又如何呢?(在Rseek上尝试使用此关键字)
loon
还有waddella.github.io/loon,Credit 转到@hadleywickham指出了这一点。
PerformanceAnalytics中的chart.Correlation函数提供与plot.pairs函数@Stephen Turner相似的功能,不同之处在于它使用黄土函数而不是线性模型进行平滑,并且具有相关性。
library(PerformanceAnalytics)
chart.Correlation(iris[-5], bg=c("blue","red","yellow")[iris$Species], pch=21)
如果您正在寻找可能与关联相关的转换,那么ace
可以在acepack
软件包(可能还有其他软件包)中找到尚未提及的可能有用的工具。这是一个尝试许多不同变换(使用平滑器)以查找变换以最大化一组x变量与ay变量之间的相关性的交互过程。然后,绘制变换可以建议有意义的变换。