如何选择合适的ķk实现匿名性?ķk

数据挖掘 匿名化
2022-03-03 12:36:42

您如何选择合适的来实现匿名性存在哪些与问题的业务上下文无关的方法?kk

1个回答

在大多数情况下来自数据的数量和性质,以及使用的匿名方法很少有人对进行显式控制,除非通过这些选项隐式控制。kk

视为分数而不是参数。k

例如,某些记录可能比其他然后平均计数,甚至最小值。kk

的最高可能值就是所需要的。由于每条记录只有相似的记录,因此可以使用方法来详尽地找到匿名信息,因此需要尽可能高的以减慢该过程并使其几乎不可能。kk1k

当然,最大是在所有数据列都匿名的情况下实现的,但这会产生无用的数据,因此有用数据和最大匿名性之间的权衡会导致要达到的值范围(这取决于数据的实际性质和数量) )。kk