森林图像中的检测痕迹


30

有谁知道有任何研究/论文/软件来识别森林场景图像中的踪迹(从直线或点对点曲线)(从沿着踪迹某处的相机的角度来看)?

我正在尝试找到一种可以拍摄像这样的图像的算法:

替代文字

并制作一个遮罩,标识可能的“痕迹”,例如:

替代文字

如您所见,原始图像有点模糊,这是有目的的。图像源无法保证完美对焦,因此我需要能够处理合理数量的噪点和模糊度。

我的第一个想法是应用高斯模糊,然后将图像分割为块,比较相邻块以寻找明显的色差(指示轨迹“边缘”)。但是,我很快意识到阴影和照明的其他变化很容易使它消失。

我当时正在考虑提取SURF特征,但是只有当图像完全清晰且光照一致时,SURF / SIFT才成功。

我还尝试将图像和蒙版缩放到更小的尺寸(例如100x75),将它们转换为1xN向量,并使用它们来训练基于FANN的神经网络(其中图像是输入,而蒙版是所需的蒙版)输出)。即使是这么小的尺寸,只有1个隐藏层占输入向量大小的75%,训练仍然花费了6个小时,而且仍然无法预测测试集中的任何遮罩。

有人可以针对该主题提出任何其他方法或论文吗?


1
您没有提及任何内容,但是您控制相机/图像采集吗?人们在类似情况下使用近红外图像来使用植被指数(考虑从卫星计算森林覆盖率)。如果您有近红外线,则可以直接解决该问题。
2011年

我有,有点。我正在使用便宜的单筒相机(网络摄像头/手机相机)拍摄图像,但我不认为它们会存储红外线。
Cerin

使用可以区分植被和污垢光谱的多个滤色镜可能会有所帮助
Endolith 2011年

我很好奇您是否尝试过贝叶斯方法进行训练和检测。我有几天前写的答案,但后来删除了它,因为我认为您在尝试后已将其关闭。如果您尚未考虑该选项,我很乐意取消删除它。
Lorem Ipsum

@yoda,贝叶斯方法是什么意思?我只熟悉贝叶斯应用于离散分类和逻辑网络。我不熟悉将其应用于简历。我不记得您看到过任何帖子。
塞林

Answers:


13

它本身可能还不够,但是由于问题之一与照明变化有关,因此阴影去除预处理步骤可能会有所帮助。我正在考虑的技术在以下论文中进行了描述:

“关于去除图像中的阴影”,GD Finlayson,SD Hordley,C。Lu和MS Drew,IEEE模式分析和机器智能(PAMI),第28卷,第1期,2006年1月,第59- 68。 http://www.cs.sfu.ca/~mark/ftp/Pami06/pami06.pdf

该过程的第一部分生成照度不变的灰度图像,在这种情况下,这可能就是您想要的。这是他们在论文中给出的示例的快照:

去除阴影
(来源:datageist.com

实际上,将处理过程更进一步以产生“色度”图像可能是您需要清晰地区分活叶和枯叶的条件。再次,本文提供了一个示例:

色度
(来源:datageist.com

但是要注意的是,相机需要首先进行校准。假设有可能,它们描述的表示形式的某种组合可能会使您使用的其他方法更有效。


12

我认为您源图像中没有足够的信息来生成蒙版图像。您可能会先按颜色进行细分,即绿色不是尾迹,灰色/棕色是尾迹。但是,遮罩中未显示“足迹边界”上的灰色/棕色区域。(请参见源图像的左下象限。)

您提供的遮罩暗示了源图像中不明显的结构约束:例如,您的迹线具有固定宽度-然后您可以使用该信息来约束模式识别器返回的初步遮罩。

继续讨论结构性主题:路径是否与其他路径合并?路径是否具有某些土壤/砾石特征?作为一个人类(相当擅长模式识别!),我受到左下象限中显示的功能的挑战:我看到灰色/棕色区域无法作为“足迹”打折。如果我掌握了更多信息,也许可以结论性地做到这一点:一张地图和一个大概已知的位置,在这条路上的个人经历,或者可能是导致这一点的一系列图像-如果识别器“知道是什么导致了这一幕。

我认为,收集图像是最有趣的方法。继续这一思路:一幅图像可能无法提供足够的数据,但是全景视图可能会模糊场景。


是的,足迹与其他人合并。是的,足迹由土壤/砾石特征来描绘,因为这些特征应与非足迹区域不同。我同意,该图像在某些部分可能具有挑战性,但我仍然认为有足够的信息可以对路线的位置做出很好的猜测。即使您不熟悉这条路线,听起来也没有问题(除了左下角的区域,这是可以理解的)。

确实,我可以很好地猜出这条路的边界。但是,恐怕我所依赖的信息多于源图像中提供的信息。我“知道”一条路径是什么-大概是因为我已经建立了一条包含路径的显着特征的模型或模板:通过直接体验,或在图片中看到定义明确的路径等。总结:在识别路径时在源图像中,我所绘制的内容比在源图像中所观察到的更多。

视觉系统可能会利用该路径的一些特征:大概我们可以假设该路径代表自由的可导航空间。因此,树木,灌木丛和岩石特征可以归类为“非足迹”。也许纹理分析可以帮助辨别这些?不过,我不确定:树下的地面(从左上到中)看起来与小径非常相似。

我的第一个想法是引用LU或Eigen变换,当纹理非常粗糙时,它们会产生很高的响应。但是,这里的足迹与非足迹之间的主要区别似乎是颜色。因此,也许将其转换为HSV色彩空间,并从具有“土”色(棕褐色或cher石色)的像素制作遮罩,即可得出粗略估计。
AruniRC

12

没有任何一种算法可以神奇地检测随机图像中的踪迹。您将需要实现一个基于机器学习的例程,并对其进行“训练”以检测踪迹。无需赘述太多,这是您在监督学习方法中将要进行的工作的粗略概述。

  1. 您将需要一组“培训示例”,我的意思是在不同环境中的多条路径照片,您(主管)已在其中标记了什么算作“足迹”,什么是背景“森林”。您可以将图像分解为较小的部分(通常为8x8),然后通过对块进行DCT(离散余弦变换)将其转换为“特征空间”。在这种情况下,每个块的DCT给您一个64点的“特征向量”。
  2. 定义特征空间,特征集(64点特征向量的子集)和具有类和的类空间,可以计算出从您的训练集中:XxYy1=traily2=forest

    • 类条件分布
      • PX|Y(x|trail),即类为时的条件密度。 trail
      • PX|Y(x|forest),当类为时的条件密度。 forest
    • 班级概率或先验概率
      • traillPY(trail),在块中找到概率trail
      • forestPY(forest),在块中找到概率forest
  3. 使用此工具,您可以测试图像(再次将其分解为较小的部分)并计算后验概率。使用贝叶斯决策理论,您将定义二进制(在这种情况下)选择标准,例如

    y~i(x)=argmaxyiPX|Y(x|yi) PY(yi)
    ,您将每个块分配给具有最高后验概率的类别。这将导致您的二进制掩码。

请注意,这是该方法的非常简化的概述。需要考虑几件事,其中最重要的是为您的问题选择正确的功能集。您还可以做一些更复杂的事情,例如使用混合模型和基于核的密度估计,但是所有这些都太详细了,很费时间,无法编写答案。

为了激发并确认这种方法值得尝试,以下是我很久以前作为课程作业所做的一个示例,该示例与您要实现的目标非常相似。目的是从背景植被中检测出动物(左图)。右图显示了“学习”后获得的用于区分前景和背景的二进制掩码。

在此处输入图片说明 在此处输入图片说明

要了解有关机器学习的更多信息,您可能需要看几本教科书。该领域的一本知名且经常推荐的教科书是:

T. Hastie,R。Tibshirani和J. Friedman,《统计学习的要素:数据挖掘,推理和预测》。施普林格出版社第二版(2008)

现在可以通过提供的链接以免费PDF格式获得。另一本不错的书是:

RO Duda,PE Hart和DG Stork,《模式分类》,第二版,John Wiley&Sons(2001)


1
关于这一点,我想指出ml-class.org,它是机器学习的绝佳入门。
2011年

有趣的方法。但是,当您说Py(线索)和Py(森林)是“在整个图片中找到一条迹线的可能性”时,您是说在8x8的块中还是在整个图像中找到它们的可能性?如果整个图像,我都想这两个都是100%,因为所有训练图像都会在某个地方有这两个图像。
塞林

@Cerin:对不起,Py(trail),我的意思是在一个街区找到它的可能性。因此,这就是在整个图片中具有尾随的所有块的总数。我已对其进行编辑以更正此问题
Lorem Ipsum

您将如何定义特征空间X?您是否会使用类似K-Means聚类的方法将64点特征向量的维数减少到10个特征?
塞林

@Cerin是的,K均值是降低维数的常用方法之一。
Lorem Ipsum


5

看起来好像是纹理分割(不是颜色分割)的问题,有很多方法,

他们经常使用Gabor小波,例如 http://note.sonots.com/SciSoftware/GaborTextureSegmentation.html

基于超像素的细分 http://ttic.uchicago.edu/~xren/research/superpixel/

和类似的图形切割分割 http://en.wikipedia.org/wiki/Graph_cuts_in_computer_vision

这是Wiki概述 http://en.wikipedia.org/wiki/Segmentation_(image_processing)


gabor纹理分割看起来不错!
nkint 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.