在不被识别的情况下发布扫描是一个艰难的提议。信息泄露存在多种风险,缓解措施在技术上很复杂。但是,任何决心这样做的人都可以学习适当的技术,并且有免费软件可以完成这项任务。
免责声明:虽然我认为自己在技术上对上述问题很了解,并且我已经包含了它们存在的参考资料,但这个答案的某些部分是推测性的。
风险:
扫描仪是否会在每个扫描页面上添加任何视觉上的唯一指纹(或更糟糕的是:有关连接设备的信息等)?
考虑到某些打印机会这样做,这似乎是可能的。不过,关于扫描仪的信息并不多。
扫描仪是否会在每个扫描文件中添加任何数字(例如二进制)指纹(或者更糟糕的是:有关连接设备的信息等)?
如果您正在从连接的 PC 进行扫描(正如您的问题所暗示的那样),答案是 否定的,扫描仪不能。连接到 PC 的扫描仪传输的是光栅图像数据,而不是文件,因此它不可能将数据添加到它无权访问的文件中。
但是,您应该考虑可以在 PC的扫描软件上添加数字指纹。
此外,如果扫描仪是独立的(它将文件保存到 USB 驱动器,或通过电子邮件发送),这是绝对可能的。
扫描仪是否具有独特的“技术上不可避免的”指纹,因此每个扫描仪的扫描方式都不同?这个指纹是否可以计算甚至存储在某个地方?或者想要对我进行去匿名化的“机构”是否必须访问我的扫描仪才能进行比较?
是的。大多数现代扫描仪都使用 CCD 传感器,这些传感器使用专门的软件可以通过其噪声模式进行唯一 识别。
其他可能的视觉指纹目标:
使用这些指纹技术,似乎可以从扫描中识别出扫描仪型号和纸张类型,但是如果不访问它们进行比较,识别所使用的特定扫描仪和纸张页面将很难(可能是不可能的)。
PDF 是否“存储”与主机相关的任何信息?
是的,甚至有一篇关于它的 NSA 文章。在处理扫描文档时,您需要了解图像文件元数据,例如,PNG 和 JPG 文件中也可能存在这些元数据。
您没有提到的另一个风险是扫描仪本身可能会存储您的扫描副本。大型打印机可以
当然,这并不是一份详尽的风险清单——只是我在写这个答案的几分钟内想到的。我敢肯定,为此付费的研究人员、情报机构和警察可以想出更好的主意!
减轻
最简单、最安全和明显的缓解措施是不要使用可以与您的身份相关联的扫描仪,并在事后销毁扫描仪。当然,这并不总是可以实现的,那么您还能做些什么来保护自己呢?
不要使用独立的扫描仪——尤其是联网的扫描仪。如果确实必须,请将其输出转换为没有元数据的纯图像。
对于(至少部分)减轻软件添加的指纹,您需要使用开源软件,用于操作系统和扫描程序。避免使用您的个人 PC 进行扫描,或者至少使用安全的实时操作系统
为了检测故意的视觉指纹,最好的选择是扫描空白页并寻找明显的异常。这些可能非常小,因此您可能需要使用图像编辑器来提高对比度。
一般来说,对于传感器、纸张和视觉指纹,您希望破坏细微的扫描伪影。使用图像编辑器:
- 添加噪音
- 使用降噪滤波器(积极降噪)
- 旋转
- 扭曲图像(例如,通过应用多个相机“镜头校正”)
- 将图像转换为灰度
- 增加对比度(或者,最好完全转换为黑白)
- 降低分辨率(最好通过接近非理性的因素)
- 压缩图像(例如高 JPEG 压缩)
一般来说,尽一切可能混淆和减少图像中包含的信息量,同时保持文档的合理可读性。
最后,在所有其他步骤之后,从您的文件中删除 medatadata。您可以使用专门的软件来执行此操作。