邮政编码是否被视为个人识别信息?

信息安全 隐私
2021-08-09 00:55:16

一家金融公司的公共网站(属于 SEC)有一张美国的 HTML 5 地图,地图上的每个点都是其客户的 5 位邮政编码。这些点是从从服务器拉到浏览器中的 CSV 文件生成的,因此您实际上可以自己下载 CSV 文件。CSV 文件包含邮政编码本身的城市、邮政编码和纬度/经度,而不是客户的街道地址。

我想知道,仅邮政编码是否被视为个人识别信息?

4个回答

Netflix 曾经计划举办一场比赛(以改进电影推荐),他们将发布电影租借历史、电影评论以及出生日期、性别和五位数的邮政编码。这种组合是个人识别信息,如果可以从他们的租赁历史中推断出来,它可以做一些事情,比如找出某人的私人性别身份。

一项著名的研究发现,通过出生日期、性别和五位数的邮政编码,您可以唯一识别大约 87% 的美国人它还发现,您可以通过结合出生年份、性别和邮政编码来唯一识别大约 100,000 名美国人 (0.04%)。

对于受保护的健康信息 (PHI) 的医疗去识别化,美国卫生与公众服务部建议将五位邮政编码的最后两位截断,除了 17 个罕见的邮政编码开头(少于 20,000 人)根据美国人口普查共享这三个初始数字)(特别是 036、059、063、102、203、556、692、790、821、823、830、831、878、879、884、890、893)在这种情况下您应该用全零替换邮政编码。

同样,您应该注意特殊情况下的年龄等字段很少见(例如,只有一个美国人的年龄为 116 岁),因此 HHS 建议将这些特殊年龄归为一类(例如,90 岁以上)。将其他用户分组为年龄类别(如 50-55 岁)可能会更好,以帮助他们进一步匿名。

就其本身而言,没有。您无法仅通过知道个人邮政编码来识别个人。邮政编码只是人口统计信息。

但是,您也许可以结合大量个人人口统计数据来识别某人。邮政编码 + 年龄 + 性别 + 收入可能很容易就足以识别某人。如果我告诉你 A 是男性,60 岁,住在邮政编码 98039,去年收入 20 亿美元,你可能会猜我说的是比尔盖茨。(我不知道比尔去年赚了多少,但我想说明一点)。

关键是单独的非 PII 人口统计信息的聚合本身可以成为 PII。

是的,当然这是个人识别信息。它提供了关于一个人的识别信息,那么为什么在地球上可能会被认为是不同的呢?

想象一个小镇的店主说:“我想今晚回家后我会投资[非常不受欢迎的公司]。” 他的顾客说:“如果你这样做,我再也不会在这里购物了!” 那天晚上,客户看到公司地图上出现了该邮政编码的另一位投资者。

你认为顾客停止在那家商店购物是不合理的吗?你会认为其他人听到这个故事后也停止在那里购物是不合理的吗?请记住,小镇,以前可能根本没有任何投资者。

您认为店主随后起诉该公司泄露其私人投资信息,从而损害其业务是否合理?

因此,[是该网站服务的用户]和[居住在该邮政编码中]和[他们开始投资时]的组合的潜在邮政编码数量将是唯一标识的,显然是非常巨大的。

但比这更糟糕。

以下邮政编码只有一个人口:05141、67843、88264、98222、99790。10 岁以下人口的邮政编码有一百多个。11109 的面积只有两个街区。如果你住在 38639,你也是黑人。如果你住在 02562,你是白人(两者的概率都高于 99%)。如果你住在比佛利山庄 90210,你就很有钱,每个人都知道。如果您住在 90209,您仍然很富有,但您的邮政编码可能不那么出名了。

我们有不到 80 亿人。这意味着我们只需要“33 位熵”——即 33 个是/否问题,将人口大致分成两半,比如“你是男性”、“你住在中国/印度以外吗”等等——识别任何个人。一个邮政编码提供 16 位信息(人口最多的两个邮政编码有超过 110,000 人)和完整的 33 位信息(上面的 6 个邮政编码)。也就是说,仅邮政编码就至少是唯一标识任何人所需信息的一半。

[编辑:当然,在美国,企业就是人。许多技术人员为零的公司都有自己的邮政编码。如果该公司投资另一家公司,他们可能不喜欢公开发布该信息。]

[Edit2:邮政编码被马萨诸塞州(https://casetext.com/case/tyler-v-michaels-stores)和加利福尼亚州(http://scocal.stanford.edu/opinion/pineda-v明确称为 PII -威廉姆斯-索诺玛-33947)。]

不,就其本身而言,邮政编码不是 PII。这是人口统计数据,但由于可能有成千上万的人生活在一个邮政编码中,因此仅凭邮政编码就无法识别它代表的个人。在这种情况下,如果公司的多个客户在一个邮政编码中,则一个邮政编码也可以代表多个客户。因此,几乎按照定义,它不可能是 PII,因为它不能唯一标识单个个体。