我刚刚在阅读
Zeiler, MD 和 Fergus, R.,2014 年 9 月。可视化和理解卷积网络。在欧洲计算机视觉会议上(第 818-833 页)。施普林格国际出版社。(链接,我的总结)
和(部分)
Mahendran, A. 和 Vedaldi, A.,2016。使用自然原图像可视化深度卷积神经网络。国际计算机视觉杂志,第 1-23 页。(链接,我的总结)
它们都是关于可视化在 CNN 中学习的特征。
尽管两篇论文都有介绍,但您可以在其中阅读以下内容:
- 我们对 [CNN 特征] 的理解仍然有限
- 尽管表示的性能在过去几年中一直在显着提高,但它们的设计仍然非常具有经验性
- 在本文中,为了更好地理解表示,我们开发了一系列方法来通过可视化来研究 CNN 和其他图像特征
- 没有清楚地了解为什么它们表现如此出色,或者如何改进它们
- 对于这些复杂模型的内部操作和行为,或者它们如何实现如此出色的性能,我们仍然知之甚少
尽管我喜欢这些图像,但我看不出这些方法比简单地通过网络推送所有图像并显示顶部更好-最能激活感兴趣的神经元的图像。这是评价过的吗?作者是否对其他作者之前/没有这些技术没有的功能有任何见解?
(Zeiler&Fergus 的论文至少添加了遮挡敏感性分析,这确实有帮助。但是,论文的很大一部分是 deconv-nets 的过滤器可视化。我看不出这如何有助于解决上述任何问题)