导出:从pdf复制文本而没有换行


12

在野外有一些PDF,似乎每一行文本都经过硬编码,因此当我复制文本块时,所有内容都附带了:换行符甚至是“-”分隔符。

我的问题是:如何在InDesign中创建PDF,而不会发生这种情况。

有人对此有更多了解吗?


2
我想发表评论,这是很多学术文章中的一个大问题,我没有找到解决这个问题的理由/解决方案。希望得到好的答案!
benteh '16

...因此,应该归咎于前凸轮时代的某些愚蠢做法中的某些古老的出口功能。
benteh '16

Answers:


3

这是因为可以通过多种软件和在线应用程序以多种方式生成PDF 。这些方法对文本行的处理方式不同,因此,在尝试将文本从PDF复制粘贴回InDesign之前,您永远无法说出文本的实际包围方式。

但是,InDesign导出的PDF通常将在每行的末尾保留空格,因此您不必担心在每行之后插入段落返回。要确保100%确定,请在Create Tagged PDF从InDesign导出PDF时选中该复选框。我个人将始终选中此框,并将其包括在我正在使用的任何预设中。有关该选项的更多细节在这里

如果确实遇到导出错误的PDF,并且需要清理每行文本后的尾随段落返回,则最快的选项是“查找/替换”。键入^pFind what字段,把一个空白的Change to领域。根据您的情况选择以下一项StorySelection多项,这将清除您的文本。

查找更改对话框


2

一种有效的方法是从Acrobat Pro将PDF导出为HTML,在Web浏览器中打开该文件,然后从那里复制文本。

与以文本格式导出不同,html通常不会断行。

据我所知,您无法从InDesign中阻止这种情况,这似乎是来自PDF或PDF软件的行为。任何使用“文本框/框”的发布软件都可能会在PDF中创建此类文本。


-2

因为这是pdf识别文本的方式–实际上每一行都变成一个段落(因此在结尾处返回)。没有办法,在复制后,必须使用“查找/替换”选项和隐藏字符在文档中全局进行更改。


1
但是有些pdf文件没有这种行为。使用PDF可以轻松复制整个内容。我只是想知道如何在出口期间实现这一目标。
KSPR
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.