Questions tagged «pdfminer»

5
使用Python中的PDFMiner从PDF文件提取文本?
我正在寻找有关如何使用PDFMiner和Python从PDF文件提取文本的文档或示例。 看来PDFMiner更新了它们的API,我发现的所有相关示例都包含过时的代码(类和方法已更改)。我发现的那些使从PDF文件提取文本的任务更容易的库正在使用旧的PDFMiner语法,因此我不确定如何执行此操作。 照原样,我只是在查看源代码,以查看是否可以解决。

15
我如何将pdfminer用作库
我正在尝试使用pdfminer从pdf获取文本数据。我可以使用pdfminer命令行工具pdf2txt.py将数据成功提取到.txt文件中。我目前正在执行此操作,然后使用python脚本清理.txt文件。我想将pdf提取过程合并到脚本中,从而节省了一步。 当我找到此链接时,我以为自己正在研究某些东西,但是任何解决方案都没有成功。也许那里列出的功能需要再次更新,因为我使用的是pdfminer的较新版本。 我也尝试了此处显示的功能,但是也没有用。 我尝试的另一种方法是使用调用脚本内的脚本os.system。这也是不成功的。 我正在使用Python版本2.7.1和pdfminer版本20110227。
72 python  pdf  pdfminer 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.