在 PDF 中嵌入图像会保留元数据吗?

信息安全 隐私 pdf
2021-09-06 22:47:33

我有一个 PDF 文件,我可以选择要嵌入的图像。客户不是技术人员,所以我不希望他们自己删除元数据(例如照片的 GPS 位置等)。当它们嵌入 PDF 时,PDF 会自动删除它们吗?

例如,我使用 PDFStreamer 来查找我的嵌入图像,它位于 base64:contentType="image/png" href="" [CONTENT in BASE64]中。

也许我的问题是 base64 图像编码是否包含元数据?

1个回答

是的,可能会保存 EXIF 数据,具体取决于您的 PDF 工具的工作方式。

例如,您可以将带有 EXIF 数据的 JPEG 文件放入 LibreOffice Writer,然后将该文档另存为 PDF,启用“无损压缩”并禁用“减少图像 DPI”。如果您然后从该 PDF 中提取图像(有很多工具可以做到这一点,我使用了在线工具来提高速度)JPEG EXIF 数据仍然存在。

如果您启用有损 JPEG 压缩,至少在 LibreOffice 的 PDF 导出对话框中,JPEG 似乎被重新压缩为一个新文件,其中 EXIF 数据被剥离。

在 Windows 中从图像中删除 EXIF 数据并不难,您应该能够通过该过程与它们交谈。对于每个图像,右键单击它,转到属性,转到详细信息选项卡,单击底部的“删除属性和个人信息”链接,选择“从此文件中删除以下属性”,单击全选按钮,然后单击确定。