匿名数据集

数据挖掘 数据挖掘 数据集 数据清理
2021-09-25 04:28:14

我想知道匿名数据集的最佳做法是什么?理想情况下,我应该能够在对匿名数据集进行分析后取回原始数据。我应该使用一些加密功能吗?也许是散列?

1个回答

您应该区分以下概念:

  • 加密= 以只有授权方可以读取的方式对信息进行编码。
  • 数据匿名化= 从数据集中删除个人身份信息,以便数据描述的人保持匿名。
  • 去标识化=防止一个人的身份与信息相关联,同时保留在某些情况下只能由受信任方重新链接的标识信息(与旨在不可逆的数据匿名化不同)。

您的选择取决于您的用例。