是否有专门针对深度图像的计算机视觉算法?


9

我一直在研究与基于kinect的应用程序一起使用的标记检测算法,而我能够找到的大部分工作显然都集中在“正常”图像中的特征检测上。

但是,kinect硬件(基本上,一旦您进行了调整)就可以为每个像素提供11位深度值。

此深度图像还具有围绕对象边缘投射的阴影的各种视觉伪像(例如,请参见此视频中的黑色粗边框http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related)。

虽然某些传统的机器视觉技术(例如边缘检测)可以很好地解决此问题,但其他技术则不能,而且网上似乎很少有信息讨论此问题。

举一个简单的例子,使用深度值使定位标记块的方向很简单。

那么,有没有人看过任何讨论/论文/等等涵盖处理深度图像以进行特征检测的讨论?

谁能推荐一个好的算法来检测“深度”标记(有效地用折纸块代替打印的黑白标记)?

到目前为止,我所做的就是使用opencv对图像进行即席实验,但这还不够稳定或不够快。

如果您未经试用就链接到商用机器视觉产品,请在回答中提及您认为合适的理由。


有大量的论文和程序。很抱歉,在低带宽上无法更详细地回答。请参阅RGBDemo应用程序,它包含一个对象识别器。另外,PointCloud Library(PCL),ROS,OpenCV(用于软件),以及Google学术搜索(用于论文)。您提到OpenCV对您不满意,但PCL和RGBDemo可能令人满意。

我不是在寻找展示kinect的演示的实现,也不是在寻找一些演示如何从kinect或图像处理工具包(例如opencv)生成3d模型的PC演示。我正在寻找基于深度图像的特征识别算法

RGBDemo实现这些算法。阅读代码或代码参考。

Answers:


8

我最喜欢的用于注册和识别的2.5D / 3D特征描述符是旋转图像(原始论文+ 博士学位论文中的更多细节以及可从CMU 获得的软件)。

其他最新进展(可在网上搜索适当的算法)包括:3D筛选,快点特征直方图,法向对齐径向特征(NARF),深度内核描述符。较旧的方法只是使用曲面特性(例如曲率和边缘)来识别区域补丁。

哪个最好?取决于您要查找的内容,视点不变性,其他杂波等。


7

您正确地使用了所有关键词,令您惊讶的是,您在查找材料时确实没有找到任何相关文章。

幸运的是,我可以访问IEEE Xplore数字图书馆。我之前不需要任何这些特殊算法,但是看起来非常有趣,因此这里有一些我认为可能相关的快速搜索结果(不要通过标题来判断它们,而要查看它们的摘要):

不幸的是,我认为您至少可以通过IEEE Xplore库免费获得这些论文中的任何一篇。如果您没有访问权限,则可以与Google Scholar取得联系,那里有一些免费的纸质数据库(当我还没有IEEE访问权限时,我就使用Mendeley数据库)。此外,仅谷歌搜索摘要的一部分或论文的随机部分有时会产生一些结果(您可能会偶然发现该文章的即将完成的预发布版本)。

我用来查找提到的论文的搜索查询是:3D图像深度图像kinect。查找前两个查询时,您可能还希望进行处理

希望这对您有所帮助!我感到抱歉,我无法进一步涉猎这一领域,听起来真的很有趣。



@mankoff仅是摘要,我只看到工作集中在跟踪上,似乎它专注于使用直接信息而没有太多特征检测。但是然后,我只是阅读摘要,所以不确定。

查阅论文标题足以为其中几篇论文找到PDF。另一个很好的来源是CiteSeer:citeseerx.ist.psu.edu/index感谢您的论文清单!
Rethunk
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.