参考请求 - 计算机视觉书

机器算法验证 参考 计算机视觉
2022-03-20 15:38:11

获得对计算机视觉的深刻理解的最佳书籍是什么?根据我本科课程的理解,目前几乎所有最先进的计算机视觉都只是依赖于深度学习,尤其是卷积神经网络。

  • 我已经通读了 Courville-Goodfellow-Bengio 的书,所以我觉得我对整个深度学习有广泛的理解,但我觉得我没有掌握他们的书讨论的任何具体主题只有关于卷积神经网络的章节和关于卷积神经网络应用的章节真正讨论了计算机视觉。
  • 我还阅读了 Bishop 关于机器学习的书和 Murphy 关于概率机器学习的书,所以我认为我对机器学习作为一个整体有广泛的了解,但对特定子领域的了解要少得多。
  • 我还看到推荐给我的 Szeliski 关于计算机视觉的书,我还没有读过。但是,根据内容,这本书似乎没有涵盖计算机视觉中的神经网络使用,并且考虑到最近使用卷积神经网络的领域的快速增长,我不确定这本书中的材料是否会被认为是过时的。是否仍然需要阅读这本书(或同等材料的书)才能在计算机视觉方面进行最先进的研究。如果没有必要,它至少对我来说还有价值吗?

还有什么其他建议?虽然我更喜欢更全面的文本,但这里的论文和调查论文建议也很好。我对纯数学和统计学都有很好的掌握,所以倾向于更多理论目的的参考也很好。

2个回答

据我所知,目前还没有一本包含深度学习的综合性学术计算机视觉教科书(截至 2019 年)。

将问题的讨论和表述与为解决问题而部署的算法分开是很有用的。@shimao 指出,早期的方法通常会被新的深度学习组件回收利用。Goodfellow 等人和 Bishop 的书分别是关于深度学习和机器学习的好书,但它们并没有过多地谈论计算机视觉问题。我的意思是指占用大量计算机视觉研究的任务,如噪声过滤、3D 重建、图像配准、计算摄影、运动结构等。

为了更好地理解 CV,Szeliski 的书还是相当不错的,虽然它是一个高水平的调查。CNN 主导的主题,如分割和识别,在这本书中只有两章,所以有很多有趣的材料。

我认为以下书籍也很有用,值得一看,尽管它们涵盖了经典方法:

王子,西蒙 JD。计算机视觉:模型、学习和推理。剑桥大学出版社,2012 年。

-

哈特利、理查德和安德鲁齐瑟曼。计算机视觉中的多视图几何。剑桥大学出版社,2003 年。

-

冈萨雷斯、拉斐尔和伍兹、理查德。数字图像处理。皮尔逊高等教育,2011。

如果你真的对 CV 感兴趣,我认为了解人类视觉感知和光学以及机器人学、计算机图形学和医学/科学成像等相关领域也会很有趣。

添加到@MachineEpsilon 的答案。深度学习已成为分割和对象检测等任务的实际工具。并且开始接管 3D 重建等领域。尽管如此,这仍然是一个持续的过程。

您仍然需要对射影几何有很好的了解(Hartley 和 Zimmerman 的书)才能解决诸如计量学(对图像进行精确测量)之类的任务。在某些情况下,您想要提取一些特征(如边缘或轮廓)。此外,与微调神经网络相比,使用基于特征的方法匹配和跟踪平面对象仍然是一个非常好的选择,并且更容易设置。

这种技术也是许多 SLAM 方法的核心。

我的观点是:仍然存在许多相关的用例,其中深度学习不能提供(令人满意的)解决方案,或者传统方法更容易使用。如果只是因为有像 OpenCV 这样经过充分验证的软件库。