了解SURF特征计算过程


9

因此,我正在阅读有关SURF的论文(Bay,Ess,Tuytelaars,Van Gool:加速鲁棒功能(SURF)),而我无法理解以下段落:

由于使用了框式滤镜和积分图像,因此我们不必将相同的滤镜迭代地应用于先前已滤过图层的输出,而是可以将完全相同速度的任何大小的框式滤镜直接应用于原始图像,并且即使是并行的(尽管此处未利用后者)。因此,通过扩大滤波器的大小而不是迭代地减小图像的大小来分析缩放空间,如图4所示。

This is figure 4 in question.

图4

PS:本文对整体图像进行了解释,但是本文的全部内容基于上面的特定段落。如果有人阅读了本文,您能否简要介绍一下这里发生的事情。整个数学解释都很复杂,需要首先掌握,因此我需要一些帮助。谢谢。

编辑,几个问题:

1。

每个八度细分为恒定数量的音阶。由于积分图像的离散性,两个后续比例之间的最小比例差异取决于部分二阶导数在导数方向(x或y)上正负叶的长度lo,将其设置为过滤器尺寸长度的三分之一。对于9x9滤镜,此长度lo为3。对于两个连续的级别,我们必须将此大小至少增加2个像素(每侧一个像素),以保持大小不均匀,从而确保中央像素的存在。这导致掩模大小总共增加了6个像素(请参见图5)。

Figure 5

图5

我无法理解给定上下文中的界线。

对于两个连续的级别,我们必须将此大小至少增加2个像素(每侧一个像素),以保持大小不均匀,从而确保中央像素的存在。

我知道他们正在尝试对图像的长度进行处理,即使它们试图使图像变得奇怪,以便有一个中心像素,这将使他们能够计算像素梯度的最大值或最小值。我对它的上下文含义有些怀疑。

2。

为了计算描述符,使用了Haar小波。

哈尔小波

 dX |dX|

3。

另一个

拥有近似滤波器的必要性是什么?

4. 我对他们发现过滤器尺寸的方式没有任何疑问。他们凭经验“做”一些事情。但是,我对这条线有些na

上一节介绍的9x9滤波器的输出被视为初始比例尺层,我们将其称为比例尺s = 1.2(近似σ= 1.2的高斯导数)。

他们是如何发现σ值的。此外,缩放的计算如何完成,如下图所示。我之所以要声明此图像,是因为值s=1.2不断重复出现,而没有清楚说明其起源。 比例尺图片

5. 用黑森矩阵表示的L是高斯滤波器和图像的二阶梯度的卷积。

然而,据说“近似”行列式仅包含涉及二阶高斯滤波器的项。

的值为w

我的问题是为什么行列式如此计算,近似的Hessian和Hessian矩阵之间是什么关系。


嘿! 我在您的问题中添加了作者姓名和文章标题,希望您不要介意。首先,即使链接失效,它也可使文章可搜索。其次,作为从事研究的人,我认为以作者的名字和出版物的名字来赞扬作者是我们最不愿意承认他们的工作的方法:)
penelope 2014年

@penelope:我半害怕人们会否决我。
motiur 2014年

我认为这是一个非常好的问题,是最近最有趣的问题之一。我本人从未参加过SURF,但我明天可能会尝试看看是否可以做出贡献,这个问题实际上使我很感兴趣:)和PS:如果您是作为“正式” Uni项目的一部分来这样做的, ,我相信您的主管会很乐意为您提供帮助(尤其是如果您处于硕士级别)。他们的一部分工作教你如何阅读科学文献。
penelope 2014年

PPS:您可能要编辑问题,以对术语“ 积分图像”和“ 框过滤器”进行简短说明:了解您的理解可能会帮助我们理解您不理解的概念;)
penelope 2014年

@penelope:你是一个非常漂亮的女孩/家伙,随便。而且,我不必对本文进行文献复习,我读了David Lowe于2004年和1999年撰写的一篇文章。那本书相当不稳定,此外,在YouTube上也有不错的演讲。问题在于本文中使用了大量的数学术语,即SURF。如果您没有脑中的数学模型,则很难理解主要思想。
motiur 2014年

Answers:


10

什么是SURF?

为了正确理解正在发生的事情,您还需要熟悉SIFT:SURF基本上是SIFT的近似值。现在,真正的问题变成了:什么是SIFT?

SIFT既是关键点检测器又是关键点描述符。在检测器部分,SIFT本质上是经典拐角检测器(例如哈里斯拐角)的多尺度变体,并且具有自动调整尺度的能力。然后,给定位置和补丁大小(从比例尺得出),它可以计算描述符部分。

SIFT擅长匹配局部仿射图像,但它有一个缺点:计算成本高(即长)。在计算高斯比例空间时(在检测器部分中),然后在计算梯度方向的直方图(对于描述符部分)中花费了大量时间。

SIFT和SURF都可以看作是具有自动比例(即高斯大小)选择的高斯差异。这样,您首先构建一个比例空间,在此空间中以不同比例过滤输入图像。比例尺空间可以看作是金字塔,其中两个连续的图像通过比例尺变化(例如,高斯低通滤波器的大小已更改)相关联,然后按八度音阶(即,较大的变化)对比例尺进行分组在高斯滤波器的大小)。

  • 在SIFT中,这是通过用固定宽度的高斯重复过滤输入直到达到下一个八度音阶的尺度来完成的。
  • 在SURF中,由于使用了积分图像技巧,因此不会因高斯滤波器的大小而遭受任何运行时损失。因此,您可以直接计算在每个比例尺上过滤的图像(无需使用先前比例尺的结果)。

近似部分

由于计算高斯尺度空间和梯度方向的直方图的时间很长,因此以快速逼近代替这些计算是一个好主意(由SURF的作者选择)。

作者指出,小的高斯模型(如SIFT中使用的模型)可以通过平方积分(也称为框模糊)很好地近似。这些矩形平均值具有很好的特性,这要归功于完整的图像技巧。

此外,高斯尺度空间实际上不使用本身,而是近似高斯-拉普拉斯(你可以找到这在SIFT纸)。因此,您不仅需要高斯模糊图像,还需要它们的派生和差异。因此,您只是进一步推动了用盒子近似高斯的想法:首先根据需要推导高斯多次,然后用一个正确大小的盒子近似每个波瓣。您最终将拥有一套Haar功能。

增量2

正如您所猜测的,这只是一个实现工件。目的是要有一个中央像素。相对于将要描述的图像块的中心计算特征描述符。

中部地区

列中的所有像素X=一个列中的所有像素X=-一个X

幻数

σ=1.2σ=1.2


感谢您的解释,它清除了一些内容,让我看看是否有人对此有更详尽的了解。
motiur 2014年

我已经针对您的新问题编辑了答案。
sansuiso 2014年

哦,是的,谢谢。纸很长,所以很多事情马上就去了。
2014年

想看我的最新编辑吗?
motiur 2014年

1
它是由共同的共享知识(小高斯人通过盒子模糊近似),实验(现实世界图像中感兴趣的对象的最小/最大大小)和数学(给定初始补丁大小,计算矩形和适合的高斯人)混合而成的。
sansuiso 2014年

4

为了识别潜在的兴趣点,通常使用高斯差分函数(DOG)来处理图像,从而使图像的比例和方向不变。

在SIFT中,图像金字塔是通过用递增sigma值的DOG过滤每一层并求差来建立的。

另一方面,SURF应用具有高斯拉普拉斯算子(LoG)和不同大小的平方滤波器(9 * 9、15 * 15 ...)的二阶高斯偏导数更快得多。计算成本与滤波器大小无关。sigma对于金字塔中的更高级别,没有下采样(更改),只有滤波器大小的上缩放会导致具有相同分辨率的图像。

编辑

附加一个请注意:在纸的作者在4个方向(X,Y,XY,YX)与内核进一步简化高斯二阶导数[1 -2 1][1 -2 1]'[1 -1;-1 1],和[-1 1;1 -1]。当过滤器大小增加时,您只需要扩展简化的内核区域即可实现更大的区域。它相当于具有不同比例的DOG(LoG曲线与DOG的形状相同,并且过滤器的大小使它们的宽度也相等)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.