我是一名医生,致力于以健康为导向的 ML 的方法学方面。再现性、可复制性、通用性在这一领域至关重要。在许多问题中,有些问题是由对抗性攻击 (AA) 提出的。
我的问题是从文献综述的角度考虑:假设我想从 AA 的角度检查算法:
- 是否有系统的方法可以使用,与数据格式、模型类型和 AA 相关?从概念上讲,是否存在 AA 分类法?如果是这样,实际上,一些 AA 是否被视为黄金标准?
我是一名医生,致力于以健康为导向的 ML 的方法学方面。再现性、可复制性、通用性在这一领域至关重要。在许多问题中,有些问题是由对抗性攻击 (AA) 提出的。
我的问题是从文献综述的角度考虑:假设我想从 AA 的角度检查算法:
文献中已经有几篇论文试图提供对抗性攻击的分类和调查。我将仅列出我认为足够可靠的两个,您可能可以将其用作参考。
Nikolaos Pitropakis 等人对机器学习攻击的分类和调查(2019 年),发表在《计算机科学评论》上
Adversarial Examples: Attacks and Defenses for Deep Learning (2019) 作者 Xiaoyong Yuan 等人,发表在IEEE Transactions on Neural Networks and Learning Systems 上。
不用说,有不同的对抗性攻击,例如快速梯度签名方法(FGSM),它们可以分为不同的类别,例如规避攻击或平衡攻击。您可以在这些引用的论文中找到更多信息。