Questions tagged «pdfbox»

7
如何在Java中将两个PDF文件合并为一个?
我想使用PDFBox将许多PDF文件合并为一个,这就是我所做的: PDDocument document = new PDDocument(); for (String pdfFile: pdfFiles) { PDDocument part = PDDocument.load(pdfFile); List<PDPage> list = part.getDocumentCatalog().getAllPages(); for (PDPage page: list) { document.addPage(page); } part.close(); } document.save("merged.pdf"); document.close(); 哪里pdfFiles是一个ArrayList<String>包含了所有的PDF文件。 当我运行上面的代码时,我总是得到: org.apache.pdfbox.exceptions.COSVisitorException: Bad file descriptor 难道我做错了什么?还有其他方法吗?
74 java  pdf  pdfbox 

19
使用PDFBox解析PDF文件(尤其是表格)
我需要解析一个包含表格数据的PDF文件。我正在使用PDFBox提取文件文本以稍后解析结果(字符串)。问题在于文本提取无法按我期望的方式处理表格数据。例如,我有一个文件,其中包含一个像这样的表(7列:前两列始终有数据,只有一个Complexity列有数据,只有一个Financing列有数据): +----------------------------------------------------------------+ | AIH | Value | Complexity | Financing | | | | Medium | High | Not applicable | MAC/Other | FAE | +----------------------------------------------------------------+ | xyz | 12.43 | 12.34 | | | 12.34 | | +----------------------------------------------------------------+ | abc | 1.56 | | 1.56 | | | 1.56| …
71 java  parsing  pdf  pdfbox  tabular 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.