独立电话号码是否被视为个人身份信息?

信息安全 隐私 pii
2021-09-07 20:16:55

个人身份信息 (PII) 定义为(以下示例来自 NIST)(强调我的)

可单独用于区分或追踪个人身份的信息,例如姓名、社会保险号、生物特征记录等,或与其他个人信息或与特定个人相关或可链接的身份信息(例如日期)结合使用时以及出生地、母亲的娘家姓等。

在一个电话号码的情况下,这应该如何解释,而不是与一个名字相关联?

换句话说,如果一个应用程序在没有号码所有者姓名的情况下将裸电话号码发送到服务器(我正在查看你的 WhatsApp),那么该号码仍然是 PII 吗?


编辑:乔纳·本顿在他的回答中对这个问题做了一个很好的总结,为了清楚起见,我引用了他

(...)问题指的是用户手机上的应用程序可以访问手机上的联系人(...)并将所有电话号码上传到服务器而不上传与这些号码相关联的名称的做法(尽管有访问它们。)

这些上传的没有名字的裸号码是否被视为 PII?

4个回答

这取决于。这个号码可以和一个人联系吗?(例如这是你的手机号码,如果我知道这个号码在数据库中并且知道它是你的,那么我知道你在那个数据库中)

好的。

如果这是不可能的(例如,它是连接到任何可用代理的大公司的中央呼叫号码),那么不会。

如果您只有电话号码而没有关于它们的更多信息,则必须假设它是 PII,因为您不知道一个号码是否属于个人。

我不使用WA,所以不知道具体问题指的是什么做法,但我们假设问题指的是用户手机上的应用程序可以访问手机上的联系人和文本历史记录并上传所有内容的做法电话号码到服务器,而不上传与这些号码关联的名称(尽管可以访问它们。)

这些上传的没有名字的裸号码是否被视为 PII?

是的,一点没错。

服务器不会随机收集数字序列,使用它们来填充某种模型,然后丢弃它们。

它正在构建一个持久的数据结构,该结构具有最终旨在映射到人类的实体,并将这些数字作为元数据与这些实体一起存储。(关键测试 - 当电话上的联系人有 2 个号码时,这 2 个号码是否以某种方式与同一个持久实体服务器端相关联?)

在特定时间点的整体架构中的特定放大点,没有直接与关系数据库行中的数字一起存储的名称这一事实无关紧要。

在大图架构中,包括客户端应用程序和服务器,以及当前到位的数据流以及无需用户操作即可合理轻松地到位的数据流 - 例如,收集名称的应用程序更新也可以在没有用户知识或额外许可的情况下轻松推出 - 大图,这是一个具有 PII 的架构图。

PII 是森林级别的问题,而不是树级别的问题。

PII 是根据欧洲议会第 2016/679号条例直接或间接与个人相关的任何事物

“个人数据”是指与已识别或可识别的自然人(“数据主体”)相关的任何信息;可识别的自然人是可以直接或间接识别的人,特别是通过参考诸如姓名、身份证号、位置数据、在线标识符或特定于身体、生理、该自然人的遗传、心理、经济、文化或社会身份;

从上述法规的定义部分

因为您可以将电话号码与一个人(合同的所有者)关联起来,并且该号码可能对该人是唯一的,所以您应该将其视为 PII 信息。

我这样说是为了预防,因为您永远不知道它是公共电话号码、共享电话还是任何其他用例。

在许多情况下,即使共享号码,仍然可以将其与一个人相关联。

唯一不可能的是公用电话。

因为我们不知道这一点,所以我们不能在可能与特定人唯一关联的所有其他电话号码中冒险放松安全性。

IP地址也可以是PII,因为我们不知道是某个家庭的代理还是路由器,我们应该将它们平等对待。

更简单的解释可以在下面来自欧洲议会的链接中找到,并附有示例。

https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en

个人数据是与已识别或可识别的在世个人相关的任何信息。收集在一起的不同信息可以导致对特定人的识别,也构成个人数据。已被去识别、加密或假名但可用于重新识别个人的个人数据仍然是个人数据并且属于在法律范围内。以无法识别或无法识别个人身份的方式匿名化的个人数据不再被视为个人数据。为了使数据真正匿名,匿名化必须是不可逆转的。法律保护个人数据,无论用于处理该数据的技术如何——它是技术中立的,适用于自动和手动处理,前提是数据按照预定义的标准(例如字母顺序)进行组织。数据的存储方式也无关紧要——在 IT 系统中、通过视频监控或在纸上;在所有情况下,个人数据均受 GDPR 中规定的保护要求的约束。

是的

毫无疑问,清晰而根本;并且在 WhatsApp 等社交媒体环境中使用时具有特别强烈的影响。

问题不在于 WhatsApp 在将其发送到他们的服务器时是否将此电话号码链接到某个名称。问题是信息本身(电话号码)与您这个人相关联。PII 与其说是使用情况,不如说是一些数据的静态信息内容。

当然,这是有学位的。例如,出生日期。如果我只是从我在一个拥有 1000 万居民的城市最繁忙的街道上遇到的一个人那里随机抽取出生日期(没有任何附加信息)的样本,那么这个出生日期可能无法帮助我以后识别这个人。但如果我在一个小教室里做同样的事情,我很有可能会这样做。(生日悖论无济于事。)

在电话号码或社会识别号码等的情况下,情况非常清楚 - 我可以立即识别世界上与该号码相关的单身人士(可能来自电话簿,可能只是通过打电话并获取他们如果他们不小心,请命名)。

使用这种裸电话号码的潜在不祥情况很多;例如分析(通过与包含该数字的其他记录匹配);发现人群(通过获取在应用程序中以某种方式分组的一组数字);等等。