导出:从 pdf 复制文本,不带换行符

平面设计 土坯设计 pdf 出口
2022-01-26 05:54:43

在野外有一些 PDF,其中每一行文本似乎都是硬编码的,所以当我复制一个文本块时,一切都随之而来:换行符,甚至是“-”分隔符。

我的问题是:如何在不发生这种行为的 InDesign 中创建 PDF。

有人知道更多吗?

3个回答

这是因为可以通过多种软件和在线应用程序以多种方式生成 PDF。它们中的每一个都以不同的方式处理文本行,因此在您尝试将文本从 PDF 复制粘贴回 InDesign 之前,您永远无法判断文本的实际包含方式。

然而, InDesign 导出的 PDF通常会在每行末尾保留空格,因此您不必担心在每行之后插入段落返回。为确保 100% 确定,请在Create Tagged PDF从 InDesign 导出 PDF 时选中该复选框。就个人而言,我将始终选中此框并将其包含在我正在使用的任何预设中。有关此选项的更多详细信息,请点击此处

如果您确实遇到了导出错误的 PDF并且需要清理每行文本后返回的尾随段落,那么最快的选项是查找/替换。在字段中输入并^pFind what字段中放置一个空格Change to根据您的情况选择一个StorySelection以下,这应该会清理您的文本。

查找更改对话框

一种可行的方法是从 Acrobat Pro 将 PDF 导出为 HTML,在 Web 浏览器中打开该文件,然后从那里复制文本。

与导出为文本格式不同,html 通常不会换行。

据我所知,您无法从 InDesign 中阻止这种情况,这似乎是来自 PDF 或 PDF 软件的一种行为。任何使用“文本框/框”的发布软件都有可能在 PDF 中创建这种文本。

这是因为这是 pdfs 识别文本的方式——每一行实际上都变成了一个段落(因此在它的末尾返回)。没有办法,你必须在文档中全局更改它,复制后,使用查找/替换选项和隐藏字符。