Java的CSV API [关闭]


164

任何人都可以推荐一个简单的API,该API允许我使用它读取CSV输入文件,进行一些简单的转换然后编写。

一个快速的Google发现http://flatpack.sourceforge.net/看起来很有希望。

在将自己与该API结合之前,我只是想查看其他人正在使用什么。


在软件库上寻求建议时,请使用姊妹网站“ 软件建议堆栈交换”对Java和CSV好几项
罗勒·布尔克

Answers:


32

Apache Commons CSV

查看Apache Common CSV

该库可读写CSV的多种变体,包括标准的RFC 4180。还读取/写入制表符分隔的文件。

  • 电子表格
  • Informix卸载
  • InformixUnloadCsv
  • 的MySQL
  • 甲骨文
  • PostgreSQLCsv
  • PostgreSQL文本
  • RFC4180
  • TDF

我已经使用了沙盒Commons CSV了很长时间,但从未遇到过问题。我真的希望他们能将其提升到一个完整的地位,并从沙盒中脱颖而出。
亚历克斯·马歇尔

3
@ bmatthews68沙盒链接已失效-好像它已移至apache commons适当的(我也在答案中编辑了链接)
drevicko 2013年


83

我过去曾经使用过OpenCSV

import au.com.bytecode.opencsv.CSVReader;

字符串fileName =“ data.csv”;
CSVReader reader =新的CSVReader(新的FileReader(fileName));

//如果第一行是标题 String []标头= reader.readNext();
//遍历reader.readNext直到返回null 字符串[]行= reader.readNext();

另一个问题的答案中还有其他选择。


不幸的是,OpenCSV的最新下载版本(在评论时为v2.2)无法编译,并且它们不提供预构建的二进制文件。
2011年

9
我从SourceForge下载的软件包在deploy文件夹中有一个二进制文件。
Mike Sickler 2011年

8
如果您使用的是maven,请注意,官方网站上的依赖项代码包含版本声明“ 2.0”,其中存在一些错误,但是存储库中有更新的2.3版。
圆角2012年

这个lib不在单独的线程中写文件,不是吗?
Ewoks 2014年

3
根据github.com/uniVocity/csv-parsers-comparison平均比uniVocity慢73%。–
Ewoks

32

更新:此答案中的代码适用于Super CSV 1.52。可以在项目网站上找到Super CSV 2.4.0的更新代码示例:http : //super-csv.github.io/super-csv/index.html


SuperCSV项目直接支持CSV单元的解析和结构化处理。在http://super-csv.github.io/super-csv/examples_reading.html中,您会找到例如

给一堂课

public class UserBean {
    String username, password, street, town;
    int zip;

    public String getPassword() { return password; }
    public String getStreet() { return street; }
    public String getTown() { return town; }
    public String getUsername() { return username; }
    public int getZip() { return zip; }
    public void setPassword(String password) { this.password = password; }
    public void setStreet(String street) { this.street = street; }
    public void setTown(String town) { this.town = town; }
    public void setUsername(String username) { this.username = username; }
    public void setZip(int zip) { this.zip = zip; }
}

并且您有一个带标题的CSV文件。假设以下内容

username, password,   date,        zip,  town
Klaus,    qwexyKiks,  17/1/2007,   1111, New York
Oufu,     bobilop,    10/10/2007,  4555, New York

然后,您可以创建UserBean的实例,并使用以下代码用文件第二行中的值填充该实例

class ReadingObjects {
  public static void main(String[] args) throws Exception{
    ICsvBeanReader inFile = new CsvBeanReader(new FileReader("foo.csv"), CsvPreference.EXCEL_PREFERENCE);
    try {
      final String[] header = inFile.getCSVHeader(true);
      UserBean user;
      while( (user = inFile.read(UserBean.class, header, processors)) != null) {
        System.out.println(user.getZip());
      }
    } finally {
      inFile.close();
    }
  }
}

使用以下“操作规范”

final CellProcessor[] processors = new CellProcessor[] {
    new Unique(new StrMinMax(5, 20)),
    new StrMinMax(8, 35),
    new ParseDate("dd/MM/yyyy"),
    new Optional(new ParseInt()),
    null
};

1
您的代码无法编译,因此我提交了一些更正。另外,ParseDate()无法正常工作,因此我将其替换为读取String。可以稍后解析。

1
最大的局限性:SuperCSV不是线程安全的,尽管它的功能可能更多,我还是去看Jackson
ZiglioUK 2014年

SuperCsv也不允许使用多图。很高兴看到它可与MultiMaps一起使用。
Sid

19

阅读CSV格式的说明使我感到,使用第3方库要比自己编写它要容易得多:

维基百科列出了10个或一些已知的库:

我比较了使用某种检查表列出的库。OpenCSV成为我的赢家(YMMV),获得以下结果:

+ maven

+ maven - release version   // had some cryptic issues at _Hudson_ with snapshot references => prefer to be on a safe side

+ code examples

+ open source   // as in "can hack myself if needed"

+ understandable javadoc   // as opposed to eg javadocs of _genjava gj-csv_

+ compact API   // YAGNI (note *flatpack* seems to have much richer API than OpenCSV)

- reference to specification used   // I really like it when people can explain what they're doing

- reference to _RFC 4180_ support   // would qualify as simplest form of specification to me

- releases changelog   // absence is quite a pity, given how simple it'd be to get with maven-changes-plugin   // _flatpack_, for comparison, has quite helpful changelog

+ bug tracking

+ active   // as in "can submit a bug and expect a fixed release soon"

+ positive feedback   // Recommended By 51 users at sourceforge (as of now)

8

我们使用JavaCSV,效果很好


3
该库的唯一问题是,\r\n当不在Windows上运行时,它将不允许您使用Windows行终止符()输出CSV文件。作者多年未提供支持。我不得不分叉它以允许缺少的功能:JavaCSV 2.2
Mosty Mostacho

6

对于最后一个企业应用程序,我处理了需要处理大量CSV的应用程序-几个月前-我在sourceforge上使用了SuperCSV,发现它简单,健壮且没有问题。


+1为SuperCSV,但其中包含一些尚无法解决的令人讨厌的错误,目前尚未处理新的错误,并且最新版本已存在了将近两年。但是我们在生产中使用的补丁/修改版本没有任何问题。
MRalwasser 2010年

2
@MRalwasser 超级CSV 2.0.0-beta-1最近已发布。它包括许多错误修复和新功能(包括Maven支持和用于映射嵌套属性和数组/集合的新Dozer扩展)
James Bassett 2012年

1
@ Hound-Dog谢谢您的更新,我已经注意到了新的Beta,我很高兴看到这个项目还在运行-尽管提交的频率仍然让我有些担心(几乎所有提交仅在几天之内)。但我来看一下。最终版本2.0的预计发布日期吗?
MRalwasser,2012年

2
@MRalwasser我是目前唯一的开发人员,并且有全职工作,因此,每当我有一个免费的周末时,我都会着手进行此工作-因此会零星提交:)现在,该Beta的下载量已接近1000 SF,并且没有错误,因此,希望在下个月初发布最终版本。如果您对将来的功能有任何想法,请告诉我们。
詹姆斯·巴塞特

1
SuperCSV在此阶段不是线程安全的,因此它并不是真正强大的恕我直言
ZiglioUK 2014年

5

您可以使用csvreader api并从以下位置下载:

http://sourceforge.net/projects/javacsv/files/JavaCsv/JavaCsv%202.1/javacsv2.1.zip/download

要么

http://sourceforge.net/projects/javacsv/

使用以下代码:

/ ************ For Reading ***************/

import java.io.FileNotFoundException;
import java.io.IOException;

import com.csvreader.CsvReader;

public class CsvReaderExample {

    public static void main(String[] args) {
        try {

            CsvReader products = new CsvReader("products.csv");

            products.readHeaders();

            while (products.readRecord())
            {
                String productID = products.get("ProductID");
                String productName = products.get("ProductName");
                String supplierID = products.get("SupplierID");
                String categoryID = products.get("CategoryID");
                String quantityPerUnit = products.get("QuantityPerUnit");
                String unitPrice = products.get("UnitPrice");
                String unitsInStock = products.get("UnitsInStock");
                String unitsOnOrder = products.get("UnitsOnOrder");
                String reorderLevel = products.get("ReorderLevel");
                String discontinued = products.get("Discontinued");

                // perform program logic here
                System.out.println(productID + ":" + productName);
            }

            products.close();

        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }

    }

}

写入/附加到CSV文件

码:

/************* For Writing ***************************/

import java.io.File;
import java.io.FileWriter;
import java.io.IOException;

import com.csvreader.CsvWriter;

public class CsvWriterAppendExample {

    public static void main(String[] args) {

        String outputFile = "users.csv";

        // before we open the file check to see if it already exists
        boolean alreadyExists = new File(outputFile).exists();

        try {
            // use FileWriter constructor that specifies open for appending
            CsvWriter csvOutput = new CsvWriter(new FileWriter(outputFile, true), ',');

            // if the file didn't already exist then we need to write out the header line
            if (!alreadyExists)
            {
                csvOutput.write("id");
                csvOutput.write("name");
                csvOutput.endRecord();
            }
            // else assume that the file already has the correct header line

            // write out a few records
            csvOutput.write("1");
            csvOutput.write("Bruce");
            csvOutput.endRecord();

            csvOutput.write("2");
            csvOutput.write("John");
            csvOutput.endRecord();

            csvOutput.close();
        } catch (IOException e) {
            e.printStackTrace();
        }

    }
}


2

对于StringTokenizer来说,CSV格式听起来很容易,但可能会变得更加复杂。在德国,此处使用分号作为分隔符,并且需要对包含分隔符的单元进行转义。您不会使用StringTokenizer轻松处理该问题。

我会去http://sourceforge.net/projects/javacsv


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.