有没有专门针对深度图像的计算机视觉算法?

信息处理 计算机视觉
2021-12-24 11:55:21

我一直在研究与基于 kinect 的应用程序一起使用的标记检测算法,而我能够找到的大部分工作显然都集中在“正常”图像中的特征检测上。

然而,kinect 硬件提供(基本上,一旦你调整了)每像素 11 位的深度值。

该深度图像还具有来自对象边缘周围投射的阴影的各种视觉伪影(例如,请参见此视频http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related中的强烈黑色边框)。

虽然一些传统的机器视觉技术(例如边缘检测)可以很好地解决这个问题,但其他的却不行,而且网上似乎很少有信息讨论这个问题。

举个简单的例子,一旦你找到标记块,使用深度值就可以轻松检测标记块的方向。

那么,有没有人看到任何讨论/论文/等内容涉及处理深度图像以进行特征检测?

谁能推荐一个检测“深度”标记的好算法(有效地折纸块而不是打印的黑白标记)?

到目前为止,我所做的是使用 opencv 处理图像的临时实验,但这还不够稳定或足够快。

如果您在没有经过某种试用的情况下链接到商业机器视觉产品,请在您的回答中提及您认为它合适的原因。

2个回答

我最喜欢的用于注册和识别的 2.5D/3D 特征描述符是旋转图像(原始论文 +博士论文中的更多详细信息和CMU 提供的软件)。

其他最新进展(所有可在线搜索的合适算法)包括:3D-Sift、快速点特征直方图、法线对齐径向特征 (NARF)、深度内核描述符。较旧的方法仅使用曲面属性(例如曲率和边缘)来识别区域补丁。

哪个最好?取决于您要查找的内容、视点不变性、额外的混乱等。

你把所有的关键词都说对了,我很惊讶你在找资料的时候真的没有找到任何相关的文章。

幸运的是,我可以访问 IEEE Xplore 数字图书馆。我以前不需要任何这些特定的算法,但它看起来很有趣,所以这里有一些我认为可能相关的快速搜索结果(不要用它们的标题来判断它们,看看它们的摘要):

不幸的是,我认为你不能免费访问这些论文,至少不能通过 IEEE Xplore 库。如果您没有访问权限,您可能可以使用Google 学者,并且那里有一些免费的论文数据库(当我还没有 IEEE 访问权限时,我使用了Mendeley 数据库)。此外,仅用谷歌搜索论文的摘要部分或随机部分有时会产生一些结果(您可能会偶然发现一篇几乎完成的文章预发表版本)。

我用来查找上述论文的搜索查询是:3D imagedepth imagekinect您可能还希望在查找前两个查询时进行处理。

希望这会有所帮助!我很抱歉我无法深入探讨这个主题,听起来真的很有趣。