什么是差分隐私?

信息安全 隐私
2021-08-19 16:58:16

目前我听说过很多关于差分隐私的信息,但我无法找出它在非数学家语言中的确切含义。到目前为止,我的理解是,它会为他查询数据库的答案增加噪音。

1个回答

维基百科页面有数学,但也有一个例子,可能有启发性也可能没有启发性:如果您可以向数据库询问第1行到第 n行的列的值的总和,那么对n-1n的请求允许您重建有关第n行的信息。因此,允许查询“前n行的所有值的总和”并返回确切的结果可能会被滥用来学习每行的确切信息。

差分隐私是一个数学概念,通过该数学概念来衡量数据库保留匿名性的程度(即避免上述问题)。添加随机噪声是一种实现(希望)某种给定级别的差分隐私的方法。这不是唯一可能的方法,但至少实现起来相对简单,我们可以计算出它保护匿名性的程度,即在数学形式中,“数据库”表达式中“ε”的实现值是多少确保ε-差分隐私”。

添加噪音是一种权衡:它以牺牲可用性为代价提供了一些隐私,因为返回的值是“嘈杂的”,因此不精确。如果您想要更多隐私,则必须降低数据库答案的质量。对差分隐私的研究集中在寻找新的算法,以便对统计查询返回更准确的答案,同时更好地保护隐私。这种新颖的算法在数学上很重。