人工智能 - 在神经网络训练期间，如果输入的训练数据被加密（同态），梯度会泄漏敏感信息吗？ - 吾爱随笔录

在神经网络训练期间，如果输入的训练数据被加密（同态），梯度会泄漏敏感信息吗？

人工智能神经网络训练梯度下降人工智能安全训练数据集

2021-10-27 04:12:55

文献中的一些算法允许恢复用于训练神经网络的输入数据。这是使用权重的梯度（更新）来完成的，例如 Ligeng Zhu 等人的Deep Leakage from Gradients (2019)。

如果使用加密（同态）输入数据训练神经网络，上述算法的输出可能是什么？该算法会以明文还是加密方式恢复数据（因为它是加密的）？

1个回答

它将恢复加密的输入。

该算法从虚拟数据和虚拟标签开始，然后迭代优化虚拟梯度以接近原始梯度。这使得虚拟数据接近真实的训练数据：

x^{' *}, y^{' *} = \underset{x^{'}, y^{'}}{\arg min} {‖ \nabla W^{'} - \nabla W ‖}^{2} = \underset{x^{'}, y^{'}}{\arg min} {‖ \frac{\partial ℓ (F (x^{'}, W), y^{'})}{\partial W} - \nabla W ‖}^{2}

$\mathbf{x}^{\prime *}, \mathbf{y}^{\prime *}=\underset{\mathbf{x}^{\prime}, \mathbf{y}^{\prime}}{\arg \min }\left\|\nabla W^{\prime}-\nabla W\right\|^{2}=\underset{\mathbf{x}^{\prime}, \mathbf{y}^{\prime}}{\arg \min }\left\|\frac{\partial \ell\left(F\left(\mathbf{x}^{\prime}, W\right), \mathbf{y}^{\prime}\right)}{\partial W}-\nabla W\right\|^{2}$

随着距离最小化，算法恢复原始训练数据；在加密训练数据的情况下 - 你应该得到一个加密的输入（当结果“输入”不接近原始输入时失败）。

其它你可能感兴趣的问题

上一篇人工智能是否能够完全取代商业航班上的飞行员？下一篇深度学习可以用来帮助数学研究吗？