今天在Bruce Schneier 的博客和ArsTechnica上有新闻,介绍纽约市如何发布有关出租车/出租车司机、他们的旅行等信息。
基本上,敏感信息只是简单的 MD5 散列。由于输入是有限的(最多 3 个数字,3 个字母),很容易进行一些暴力攻击:生成所有可能的组合,然后进行回顾。
考虑到信息的性质(非常小的输入,很容易生成所有组合),如何正确匿名化这些数据?
我想到的一些方法::
通过默默无闻的安全性(使用“秘密”迭代次数)只是通过默默无闻的安全性。
附加一个通用的、唯一的盐,将蛮力增加 0%:简单地附加盐并完成。
为每个用户添加一个唯一的盐,会增加蛮力,但不会太多:取盐并计算每个盐的 3 位 3 个字母。
可以做些什么?