有哪些方法可以匿名化您的写作风格?

信息安全 匿名 操作安全
2021-08-16 05:35:33

我想如果有人怀疑一个匿名的在线角色是一个特定的真人,他也有在线可用的写作样本(如博客或社交媒体),他们将能够比较写作风格。有什么方法可以防止这种情况?应该对您的匿名帐户还是可识别的帐户进行技术处理?

3个回答

有一个用 Java 编写的名为Anonymouth的程序可以帮助解决这个问题:

Anonymouth 是一个基于 Java 的应用程序,旨在为用户提供开始对他们编写的文档进行匿名化所需的工具和知识。它通过启动 JStylo 库(同样由 PSAL 开发的作者检测应用程序)来检测文体模式并确定用户应该删除/添加的特征(如字长、二元组、三元组等)以帮助模糊他们的风格和身份。

就其本身而言,Anonymouth 的价值有限。匿名化您的 writeprint 分析需要对语言学和文体学有基本的了解。基本文体法涉及所谓的 5 特征分析,其中分析了五个主要的写作风格特征(转述自维基百科):

  1. lexical features - 对词汇的分析,作者对词汇的选择。不同的人以不同的速度使用不同的词,这可以使它们非常独特。例如,我经常使用倾向于这个词。如果我想隐藏我的 writeprint,我需要避免这种情况。使用简单、简短和常用的词可以降低此功能的潜力。

  2. 句法特征——分析作者的写作风格和句子结构,例如:标点符号、被动语态的使用和句子的复杂性。使用标准写作风格的尽可能简单的句子可以帮助削弱此功能。

  3. 结构特征- 分析作者的工作组织。这些包括段落长度、间距、缩进、牛津逗号的使用等。就像使第二个功能不那么有用一样,可以通过遵循标准写作风格而不是使用随你自然发展的写作风格来降低这个功能的用处。

  4. 特定于内容的特征- 对书面作品主题具有上下文意义的语言的分析。示例包括使用俚语或可能是陈词滥调的首字母缩略词。例如,一组僵尸网络所有者可以很容易地分为说“C&C”、“CnC”和“C2”的人。

  5. 特质特征- 对作者可能独有的错误和其他不合语法元素的分析。这是迄今为止最令人讨厌的功能之一,并导致许多人因其写作风格而被匿名。在一个非匿名身份上犯的小错误可能会延续到匿名身份,并可能将它们联系起来。

通过使用具有完全正确语法和拼写以及简短句子的标准英语,可以将其中许多功能匿名化。应避免使用成语等。也可以模仿其他作者以欺骗分析。如果所有其他方法都失败了,那么简单地等待会有所帮助。一个人的写作风格多年来一直在漂移,因此您几年前撰写的文档不太可能很容易与您现在所写的内容联系起来。这并不意味着不可能,只是更难。

这需要大量的写作样本,但理论上可以在一定程度上确定(例如,我怀疑它在法庭上是否可以接受,但他们至少可以说服自己)。防止这种情况需要你故意写出与平时完全不同的写法(或者使用一个让你的写作看起来不同的脚本,正如@DarkMatter 提到的那样)。尝试模仿您喜欢的作者的写作风格可能是手动执行此操作的一种方法(例如,作家模仿 HP Lovecraft 的写作风格当然是可能的并且很常见)。

您绝对应该更改匿名角色的写作,因为毫无疑问,您从很小的时候就开始写作,因此存在大量与您的真实身份相关的数据。

几轮谷歌翻译似乎是一个不错的选择。例如明文-->中文-->英文-->德文-->意大利文-->英文。

由于每一步的翻译不完善,您可能也会失去很多意义,但您可以校对以确保基本信息是相同的。