这个答案顺便提到了贝叶斯中毒,我已经阅读了维基百科页面,但觉得我没有完全掌握它。
第一种情况,垃圾邮件发送者发送带有有效负载(链接、恶意文件等)的垃圾邮件并包含许多非垃圾邮件的“安全”字眼,这似乎很明显。目的是提高单个电子邮件的评级,以便垃圾邮件过滤器将其归类为“非垃圾邮件”。
第二种情况更微妙并且(对我来说)令人困惑:
垃圾邮件发送者还希望通过在贝叶斯数据库中将以前无害的词变成垃圾词(统计类型 I 错误)来使垃圾邮件过滤器具有更高的误报率,因为训练垃圾邮件过滤器处理中毒消息的用户将向过滤垃圾邮件发送者添加的单词是垃圾邮件的良好指示。
这对垃圾邮件发送者有何帮助?当然,误报(如果我正确理解这意味着合法电子邮件被错误地归类为垃圾邮件)很烦人,但它们会非常普遍地完全禁用垃圾邮件过滤器。看起来这不会改变真正垃圾词的评级,还是只会影响它们的相对评级?
最后,这种方法或任何其他方法是否可以帮助个别垃圾邮件发送者使用他们想偷偷通过过滤器的几个垃圾邮件词,或者它可能会帮助所有垃圾邮件发送者?
有人可以提供或链接到基于示例的解释吗?