我正在从事一个由真实数据组成的工业项目。现在,这些数据包含无法公开披露的有关公司运营的敏感信息。因此,在实现机器学习算法之前,我需要先对原始数据进行匿名化处理。`数据匿名化包括:
changing the names of persons,
places,
geographical locations, etc.
我想知道匿名数据集的最佳做法是什么?理想情况下,我应该能够在对匿名数据集进行分析后取回原始数据。
我浏览了文献并查看了一些已回答的问题。它们都是基于cybersecurity aspects
like encryption and decryption algorithms
。我不熟悉网络安全算法。有没有办法在不深入研究网络安全算法的情况下稍微改变数据?