文件到Java中的byte []


757

如何将a转换java.io.File为a byte[]


我能想到的一种用途是从文件读取序列化的对象。
Mahm00d 2014年

2
另一个方法是使用标题查找文件类型。
James P.

试试这个byte [] bytes = null; BufferedInputStream fileInputStream = null; 试试{File file = new File(filePath); fileInputStream =新的BufferedInputStream(新的FileInputStream(文件)); // fileInputStream = Thread.currentThread()。getContextClassLoader()。getResourceAsStream(this.filePath); 字节=新的字节[(int)file.length()]; fileInputStream.read(bytes); } catch(FileNotFoundException ex){throw ex; }
Rohit Chaurasiya

Answers:


486

这取决于最适合您的方式。明智地提高生产力,不要重蹈覆辙,而是使用Apache Commons。在哪IOUtils.toByteArray(InputStream input)


29
@ymajoros:的确如此!我宁愿有一些额外的代码行,而不是其他依赖项。依赖有隐藏的成本。您需要了解该库的最新信息,在构建脚本中包括相关性,并使用代码等将其传达给其他人。如果您已经在使用具有代码的库而不是使用该库,那么我会说自己写。
Stijn de Witt

11
这回答了如何读取文件的问题,而不是如何将java.IO.File类型的对象转换为byte []的问题。
Ingo,

5
这是怎么用来读Fileto的byte[]?我正在使用Java6,所以无法使用NIO方法:(
PASTRY

4
@ymajoros您是否愿意与我们分享任何“标准三线解决方案”,所以我们不必依靠重新发明车轮依赖性吗?
matteo 2014年

3
@matteo:有吗?参见其他答案,例如Files.readAllBytes()。简单,没有依赖性。
ymajoros 2014年

1292

JDK 7中,您可以使用Files.readAllBytes(Path)

例:

import java.io.File;
import java.nio.file.Files;

File file;
// ...(file is initialised)...
byte[] fileContent = Files.readAllBytes(file.toPath());

10
我有一个File对象,而不是路径(来自http发布请求)
aldo.roman.nurena 2013年

81
@ aldo.roman.nurena JDK7引入了File.toPath()方法,该方法将为您提供路径对象。
KevinL

6
您可以从文件获取路径。尝试:File file = new File(“ / path”); 路径path = Paths.get(file.getAbsolutePath()); byte [] data = Files.readAllBytes(path);
gfelisberto

2
在java.nio中如何处理文件关闭-换句话说,上面的代码应该关闭某些东西吗?
2014年

4
@akauppi请参见答案中的链接:“该方法可确保文件已关闭...”
Bernhard Barker

225

从JDK 7开始-一种衬板:

byte[] array = Files.readAllBytes(Paths.get("/path/to/file"));

无需外部依赖。


13
与接受Apache Commons的已接受答案相比,现在这是一个更好的选择。
james.garriss

1
谢谢:)我也需要这个:String text = new String(Files.readAllBytes(new File(“ / path / to / file”)。toPath())); 这最初来自stackoverflow.com/a/26888713/1257959
cgl

5
在机器人,它需要分钟API级别为26
Ashutosh说Chamoli

2
您需要添加import java.nio.file.Files;import java.nio.file.Paths;如果尚未添加。
山姆

164
import java.io.RandomAccessFile;
RandomAccessFile f = new RandomAccessFile(fileName, "r");
byte[] b = new byte[(int)f.length()];
f.readFully(b);

Java 8文档:http : //docs.oracle.com/javase/8/docs/api/java/io/RandomAccessFile.html


2
您必须检查f.read()的返回值。有时可能会发生这种情况,您将无法读取整个文件。
bugs_ 2012年

8
仅当您在读取文件时更改文件时,才会发生这种情况。在所有其他情况下,都会引发IOException。为了解决这个问题,我建议以读写模式打开文件:RandomAccessFile(fileName,“ rw”)
Dmitry Mitskevich 2012年

5
我可以想象其他仅读取文件一部分(文件在网络共享上)的资源。readFully()具有您要搜索的合同。
DThought

3
请记住,RandomAccessFile不是线程安全的。因此,在某些情况下可能需要同步。
银行家

@DmitryMitskevich在文件系统上也可能存在其他情况,这些情况可能是未格式化的。如阅读“文件”在/ proc / Linux上可能会导致短路读取(即你需要一个循环来读它全部)

78

基本上,您必须在内存中读取它。打开文件,分配数组,然后将文件中的内容读入数组。

最简单的方法类似于以下内容:

public byte[] read(File file) throws IOException, FileTooBigException {
    if (file.length() > MAX_FILE_SIZE) {
        throw new FileTooBigException(file);
    }
    ByteArrayOutputStream ous = null;
    InputStream ios = null;
    try {
        byte[] buffer = new byte[4096];
        ous = new ByteArrayOutputStream();
        ios = new FileInputStream(file);
        int read = 0;
        while ((read = ios.read(buffer)) != -1) {
            ous.write(buffer, 0, read);
        }
    }finally {
        try {
            if (ous != null)
                ous.close();
        } catch (IOException e) {
        }

        try {
            if (ios != null)
                ios.close();
        } catch (IOException e) {
        }
    }
    return ous.toByteArray();
}

这对文件内容有一些不必要的复制(实际上,数据被复制了3次:从文件到buffer,从bufferByteArrayOutputStream,从ByteArrayOutputStream到实际的结果数组)。

您还需要确保仅在内存中读取最大大小的文件(通常取决于应用程序):-)。

您还需要对待IOException外部函数。

另一种方法是这样的:

public byte[] read(File file) throws IOException, FileTooBigException {
    if (file.length() > MAX_FILE_SIZE) {
        throw new FileTooBigException(file);
    }

    byte[] buffer = new byte[(int) file.length()];
    InputStream ios = null;
    try {
        ios = new FileInputStream(file);
        if (ios.read(buffer) == -1) {
            throw new IOException(
                    "EOF reached while trying to read the whole file");
        }
    } finally {
        try {
            if (ios != null)
                ios.close();
        } catch (IOException e) {
        }
    }
    return buffer;
}

这没有不必要的复制。

FileTooBigException是自定义应用程序异常。该MAX_FILE_SIZE常数是一个应用程序参数。

对于大文件,您可能应该考虑使用流处理算法或使用内存映射(请参阅参考资料java.nio)。


ios需要在尝试之外进行声明
Daryl Spitzer 2010年

第二个示例中的语句“ ios.read(buffer)”将仅读取文件的前4096个字节(假定与第一个示例中使用的4k缓冲区相同)。对于第二个示例,我认为读取必须在while循环内,该循环检查结果为-1(到达文件末尾)。
Stijn de Witt

抱歉,忽略我的上述评论,错过了对文件长度的语句设置缓冲区。尽管如此,我还是更喜欢第一个示例方式。一次性将整个文件读入缓冲区是不可扩展的。当文件很大时,您将有可能耗尽内存。
Stijn de Witt

“最简单”的方法将使用try-with-resources。
新浪马达尼

很酷,但是有点冗长。
Sapphire_Brick

77

有人说过,Apache Commons File Utils可能具有您所需要的

public static byte[] readFileToByteArray(File file) throws IOException

范例使用(Program.java):

import org.apache.commons.io.FileUtils;
public class Program {
    public static void main(String[] args) throws IOException {
        File file = new File(args[0]);  // assume args[0] is the path to file
        byte[] data = FileUtils.readFileToByteArray(file);
        ...
    }
}

23

您也可以使用NIO API。只要总文件大小(以字节为单位)适合int,我就可以使用此代码执行此操作。

File f = new File("c:\\wscp.script");
FileInputStream fin = null;
FileChannel ch = null;
try {
    fin = new FileInputStream(f);
    ch = fin.getChannel();
    int size = (int) ch.size();
    MappedByteBuffer buf = ch.map(MapMode.READ_ONLY, 0, size);
    byte[] bytes = new byte[size];
    buf.get(bytes);

} catch (IOException e) {
    // TODO Auto-generated catch block
    e.printStackTrace();
} finally {
    try {
        if (fin != null) {
            fin.close();
        }
        if (ch != null) {
            ch.close();
        }
    } catch (IOException e) {
        e.printStackTrace();
    }
}

我认为自从使用MappedByteBuffer以来,它的速度非常快。


2
如果仅要读取一次文件,则绝对不需要使用内存映射,并且最终它将使用的内存是普通FileInputStream的两倍。
詹姆斯

1
不幸的是MappedByteBuffer不会自动释放。
Tom Hawtin-大头钉

2
太棒了,新示例包括printStackTrace,经典的破损异常处理。
詹姆斯

我同意。.这是Eclipse的默认设置。我认为我应该抛出异常!
阿米特(Amit)

我一直在对nio进行基准测试,以便从File创建一个byte []。除了使用直接缓冲区外,它确实占用了两倍的内存。尽管对于大文件来说它的速度更快(大约是200M的缓冲IO的两倍),但对于5M左右的文件,它的损失似乎是原来的5倍。
Chaffers 2014年

22

如果您没有Java 8,并同意我的观点,那么包含一个庞大的库来避免编写几行代码是一个坏主意:

public static byte[] readBytes(InputStream inputStream) throws IOException {
    byte[] b = new byte[1024];
    ByteArrayOutputStream os = new ByteArrayOutputStream();
    int c;
    while ((c = inputStream.read(b)) != -1) {
        os.write(b, 0, c);
    }
    return os.toByteArray();
}

调用方负责关闭流。


21
// Returns the contents of the file in a byte array.
    public static byte[] getBytesFromFile(File file) throws IOException {        
        // Get the size of the file
        long length = file.length();

        // You cannot create an array using a long type.
        // It needs to be an int type.
        // Before converting to an int type, check
        // to ensure that file is not larger than Integer.MAX_VALUE.
        if (length > Integer.MAX_VALUE) {
            // File is too large
            throw new IOException("File is too large!");
        }

        // Create the byte array to hold the data
        byte[] bytes = new byte[(int)length];

        // Read in the bytes
        int offset = 0;
        int numRead = 0;

        InputStream is = new FileInputStream(file);
        try {
            while (offset < bytes.length
                   && (numRead=is.read(bytes, offset, bytes.length-offset)) >= 0) {
                offset += numRead;
            }
        } finally {
            is.close();
        }

        // Ensure all the bytes have been read in
        if (offset < bytes.length) {
            throw new IOException("Could not completely read file "+file.getName());
        }
        return bytes;
    }

另外,将numRead放入循环中。在您可以使用的最小有效范围内声明变量。仅在启用复杂的“ while”测试时才需要将其置于while循环之外。最好在循环内对EOF进行测试(如果发生,则抛出EOFException)。
Erickson

throw new IOException("File is too large!");文件过大怎么办?还有什么例子吗?
2015年

21

简单的方法:

File fff = new File("/path/to/file");
FileInputStream fileInputStream = new FileInputStream(fff);

// int byteLength = fff.length(); 

// In android the result of file.length() is long
long byteLength = fff.length(); // byte count of the file-content

byte[] filecontent = new byte[(int) byteLength];
fileInputStream.read(filecontent, 0, (int) byteLength);

有更简单的方法,例如已经提到的单线。
Sapphire_Brick

@Sapphire_Brick比较简单的方法是-但是一种衬垫并不适合所有情况。如Android。
Behr

17

从文件读取字节的最简单方法

import java.io.*;

class ReadBytesFromFile {
    public static void main(String args[]) throws Exception {
        // getBytes from anyWhere
        // I'm getting byte array from File
        File file = null;
        FileInputStream fileStream = new FileInputStream(file = new File("ByteArrayInputStreamClass.java"));

        // Instantiate array
        byte[] arr = new byte[(int) file.length()];

        // read All bytes of File stream
        fileStream.read(arr, 0, arr.length);

        for (int X : arr) {
            System.out.print((char) X);
        }
    }
}

1
我认为是“最简单的方式” :)
BlondCode

你能在这里解释吗?你为什么要吵架?
穆罕默德·萨迪克

3
没什么特别的,但是您说的是最简单的,而且我看到了更多简单的解决方案->我认为这不是最简单的。也许是几年前,但是世界正在改变。我不会用这样的声明来标记自己的解决方案。;)如果只写了“在我看来,最简单的就是..”或“我发现的最简单的..”。不想打扰您,只是想好好传达一下。
BlondCode

@MuhammadSadiq:不要导入任何东西.*,这被认为是不好的做法。
Sapphire_Brick

13

番石榴有Files.toByteArray()为您提供。它具有几个优点:

  1. 它涵盖了极端情况,即文件报告的长度为0但仍然包含内容
  2. 它经过高度优化,如果在尝试加载大文件之前尝试读取大文件,则会出现OutOfMemoryException。(通过巧妙地使用file.length())
  3. 您不必重新发明轮子。

12
import java.io.File;
import java.nio.file.Files;
import java.nio.file.Path;

File file = getYourFile();
Path path = file.toPath();
byte[] data = Files.readAllBytes(path);

这是什么JDK级别?
乔纳森·费舍尔

11

使用与社区Wiki答案相同的方法,但更加整洁且开箱即用(如果您不想导入Apache Commons lib,例如在Android上,则首选方法):

public static byte[] getFileBytes(File file) throws IOException {
    ByteArrayOutputStream ous = null;
    InputStream ios = null;
    try {
        byte[] buffer = new byte[4096];
        ous = new ByteArrayOutputStream();
        ios = new FileInputStream(file);
        int read = 0;
        while ((read = ios.read(buffer)) != -1)
            ous.write(buffer, 0, read);
    } finally {
        try {
            if (ous != null)
                ous.close();
        } catch (IOException e) {
            // swallow, since not that important
        }
        try {
            if (ios != null)
                ios.close();
        } catch (IOException e) {
            // swallow, since not that important
        }
    }
    return ous.toByteArray();
}


7

ReadFully从当前文件指针开始,将b.length个字节从此文件读取到字节数组中。此方法从文件重复读取,直到读取了请求的字节数。此方法将阻塞,直到读取了请求的字节数,检测到流的末尾或引发异常为止。

RandomAccessFile f = new RandomAccessFile(fileName, "r");
byte[] b = new byte[(int)f.length()];
f.readFully(b);

5

如果要将字节读取到预分配的字节缓冲区中,此答案可能会有所帮助。

您的第一个猜测可能是使用InputStream read(byte[])。但是,此方法有一个缺陷,使其难以合理地使用:即使没有遇到EOF,也无法保证该数组实际上将被完全填充。

相反,请看一下DataInputStream readFully(byte[])。这是输入流的包装,没有上述问题。此外,遇到EOF时将抛出此方法。好多了。


4

通过以下方法,不仅可以将java.io.File转换为byte [],而且在测试许多不同的Java文件读取方法时,它也是读取文件的最快方法:

java.nio.file.Files.readAllBytes()

import java.io.File;
import java.io.IOException;
import java.nio.file.Files;

public class ReadFile_Files_ReadAllBytes {
  public static void main(String [] pArgs) throws IOException {
    String fileName = "c:\\temp\\sample-10KB.txt";
    File file = new File(fileName);

    byte [] fileBytes = Files.readAllBytes(file.toPath());
    char singleChar;
    for(byte b : fileBytes) {
      singleChar = (char) b;
      System.out.print(singleChar);
    }
  }
}

3

让我添加一个不使用第三方库的解决方案。它重新使用了Scottlink)提出的异常处理模式。然后将丑陋的部分移到单独的消息中(我将隐藏在某些FileUtils类中;))

public void someMethod() {
    final byte[] buffer = read(new File("test.txt"));
}

private byte[] read(final File file) {
    if (file.isDirectory())
        throw new RuntimeException("Unsupported operation, file "
                + file.getAbsolutePath() + " is a directory");
    if (file.length() > Integer.MAX_VALUE)
        throw new RuntimeException("Unsupported operation, file "
                + file.getAbsolutePath() + " is too big");

    Throwable pending = null;
    FileInputStream in = null;
    final byte buffer[] = new byte[(int) file.length()];
    try {
        in = new FileInputStream(file);
        in.read(buffer);
    } catch (Exception e) {
        pending = new RuntimeException("Exception occured on reading file "
                + file.getAbsolutePath(), e);
    } finally {
        if (in != null) {
            try {
                in.close();
            } catch (Exception e) {
                if (pending == null) {
                    pending = new RuntimeException(
                        "Exception occured on closing file" 
                             + file.getAbsolutePath(), e);
                }
            }
        }
        if (pending != null) {
            throw new RuntimeException(pending);
        }
    }
    return buffer;
}

3
public static byte[] readBytes(InputStream inputStream) throws IOException {
    byte[] buffer = new byte[32 * 1024];
    int bufferSize = 0;
    for (;;) {
        int read = inputStream.read(buffer, bufferSize, buffer.length - bufferSize);
        if (read == -1) {
            return Arrays.copyOf(buffer, bufferSize);
        }
        bufferSize += read;
        if (bufferSize == buffer.length) {
            buffer = Arrays.copyOf(buffer, bufferSize * 2);
        }
    }
}

1

从文件读取字节的另一种方法

Reader reader = null;
    try {
        reader = new FileReader(file);
        char buf[] = new char[8192];
        int len;
        StringBuilder s = new StringBuilder();
        while ((len = reader.read(buf)) >= 0) {
            s.append(buf, 0, len);
            byte[] byteArray = s.toString().getBytes();
        }
    } catch(FileNotFoundException ex) {
    } catch(IOException e) {
    }
    finally {
        if (reader != null) {
            reader.close();
        }
    }

不要使用空心挡块。它使调试变得困难。
Sapphire_Brick

1
//The file that you wanna convert into byte[]
File file=new File("/storage/0CE2-EA3D/DCIM/Camera/VID_20190822_205931.mp4"); 

FileInputStream fileInputStream=new FileInputStream(file);
byte[] data=new byte[(int) file.length()];
BufferedInputStream bufferedInputStream=new BufferedInputStream(fileInputStream);
bufferedInputStream.read(data,0,data.length);

//Now the bytes of the file are contain in the "byte[] data"

1
尽管此代码可以为问题提供解决方案,但最好添加有关其原因/工作方式的上下文。这可以帮助将来的用户学习并将该知识应用于他们自己的代码。当解释代码时,您还可能以投票的形式从用户那里获得积极的反馈。
borchvm

好吧,这是我在以后的帖子中要记住的重要部分。感谢您的有用见解。
Usama Mehmood

0

尝试这个 :

import sun.misc.IOUtils;
import java.io.IOException;

try {
    String path="";
    InputStream inputStream=new FileInputStream(path);
    byte[] data=IOUtils.readFully(inputStream,-1,false);
}
catch (IOException e) {
    System.out.println(e);
}

这需要特定的JRE实现,如果在另一个JRE上运行,它将破坏应用程序。
rattaman

2
小错误:是IOException而不是IOexception,但感谢:)
Matan Marciano

1
@MatanMarciano:我的坏
Sapphire_Brick

-7

JDK8中

Stream<String> lines = Files.lines(path);
String data = lines.collect(Collectors.joining("\n"));
lines.close();

2
阅读我的讲法语的朋友的问题,它询问有关转换为“ byte []”的问题,而您的答案没有提供该问题。
凯撒·凯斯特

2
这甚至没有提供远程选项来回答转换为byte []的问题!
Anddo
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.