在神经网络训练期间,如果输入的训练数据被加密(同态),梯度会泄漏敏感信息吗?

人工智能 神经网络 训练 梯度下降 人工智能安全 训练数据集
2021-10-27 04:12:55

文献中的一些算法允许恢复用于训练神经网络的输入数据。这是使用权重的梯度(更新)来完成的,例如 Ligeng Zhu 等人的Deep Leakage from Gradients (2019)。

如果使用加密(同态)输入数据训练神经网络,上述算法的输出可能是什么?该算法会以明文还是加密方式恢复数据(因为它是加密的)?

1个回答

它将恢复加密的输入。

该算法从虚拟数据和虚拟标签开始,然后迭代优化虚拟梯度以接近原始梯度。这使得虚拟数据接近真实的训练数据:

x,y=argminx,yWW2=argminx,y(F(x,W),y)WW2

随着距离最小化,算法恢复原始训练数据;在加密训练数据的情况下 - 你应该得到一个加密的输入(当结果“输入”不接近原始输入时失败)。