对于没有复杂的外部依赖*的解决方案,现在有readxl
:
readxl软件包使从Excel到R的数据获取变得容易。与许多现有软件包(例如gdata,xlsx,xlsReadWrite)相比,readxl没有外部依赖关系,因此易于在所有操作系统上安装和使用。它旨在与存储在一张纸中的表格数据一起使用。
Readxl支持旧版.xls格式和现代的基于xml的.xlsx格式。libxls C库使.xls支持成为可能,该库抽象出了基础二进制格式的许多复杂性。要解析.xlsx,我们使用RapidXML C ++库。
可以这样安装:
install.packages("readxl") # CRAN version
要么
devtools::install_github("hadley/readxl") # development version
用法
library(readxl)
# read_excel reads both xls and xlsx files
read_excel("my-old-spreadsheet.xls")
read_excel("my-new-spreadsheet.xlsx")
# Specify sheet with a number or name
read_excel("my-spreadsheet.xls", sheet = "data")
read_excel("my-spreadsheet.xls", sheet = 2)
# If NAs are represented by something other than blank cells,
# set the na argument
read_excel("my-spreadsheet.xls", na = "NA")
*并非完全正确,它需要Rcpp
package,而后者又需要Rtools(对于Windows)或Xcode(对于OSX),它们是R外部的依赖项。但是它们不需要任何摆弄路径等事情,因此这是一个优于Java和Perl依赖项。
更新现在有rexcel软件包。这有望从Excel文件获取R格式的Excel格式,函数和许多其他类型的信息。
.csv
。