我们有一个对隐私非常敏感的人员数据的数据集,并希望用它建立一个数据库。我们公司的数据保护部门不喜欢数据科学家能够看到任何特定于一个人的数据(即使是匿名的)的想法。我们无法预先聚合数据库中的数据,因为有数百种不同的可能聚合可能很有趣。
是否有软件或 DBMS 可以确保用户只能查询包含至少 N 人组的聚合结果?
你会如何从技术上解决这个问题?
我们有一个对隐私非常敏感的人员数据的数据集,并希望用它建立一个数据库。我们公司的数据保护部门不喜欢数据科学家能够看到任何特定于一个人的数据(即使是匿名的)的想法。我们无法预先聚合数据库中的数据,因为有数百种不同的可能聚合可能很有趣。
是否有软件或 DBMS 可以确保用户只能查询包含至少 N 人组的聚合结果?
你会如何从技术上解决这个问题?
两种可能的选择:
让数据库管理对 SQL 查询设置限制,只允许返回包含最少 N 人的聚合结果的结果表。
应用差异隐私,查询结果不能用于推断任何单个个体,因此提供隐私。