我在一个分析医疗数据的工作组中。不幸的是,如果测量数据到达竞争对手或被操纵,就会有很多不信任。
所以我想知道是否有一种方法可以在测量数据离开房子之前以一种不会影响某些选定统计数据的方式“加水印”测量数据。搜索它发现大多数用于标记音频或视频的商业解决方案 - 这不适用于我们。
我在一个分析医疗数据的工作组中。不幸的是,如果测量数据到达竞争对手或被操纵,就会有很多不信任。
所以我想知道是否有一种方法可以在测量数据离开房子之前以一种不会影响某些选定统计数据的方式“加水印”测量数据。搜索它发现大多数用于标记音频或视频的商业解决方案 - 这不适用于我们。
标准方法是将其放在最低有效位或数字中;例如,您可以计算以 10 为模的数字的总和,并将其附加到数字的末尾,如果该总和大于 5,则将最后一位数字减一,以使所有统计信息几乎完好无损,如下所示:
294.090842 -> sum of digits is 38, thus mark is 8 and we add it like this: 294.0908418
294.121120 -> sum of digits is 22, thus mark is 2 and we add it like this: 294.1211202
...
这种痕迹很难注意到(除非您以正确的方式存储数据,即精确编码为有效数字的数量),即使在数据的子集中也可见,而且几乎不可能随机出现。
个性化标记可以通过使用用户特定的盐和一些更好的校验和算法来完成。
但是,请注意,此标记仅在原始数据中可见,您的竞争对手也可以通过添加小噪声或舍入数字同样轻松地将其删除。