这是哈里斯角点检测的数学表达式:
但是我有以下疑问:
- 和v的物理意义是什么?许多参考文献说,这是窗口w移动的幅度。那么窗口移动了多少?一个或两个像素?
- 窗口覆盖的像素位置上的总和是吗?
- 假设简单地,我(X ,ÿ )是在单个像素的强度(X ,ÿ )或在中心的窗口内的强度的总和(X ,ÿ )?
- 根据Wiki,他们说图像是2D,用I表示,然后要求考虑区域,然后使用符号I (x ,y )
我发现难以掌握数学解释。有人有主意吗?
这是哈里斯角点检测的数学表达式:
但是我有以下疑问:
我发现难以掌握数学解释。有人有主意吗?
Answers:
该公式的含义确实非常简单。想象一下,您拍摄了两个相同大小的图像小区域,蓝色的区域和红色的区域:
窗口函数在红色矩形外部等于0(为简单起见,我们可以假定窗口在红色矩形内部只是恒定的)。因此,窗口功能会选择要查看的像素,并为每个像素分配相对权重。(最常见的是高斯窗口,因为它是旋转对称的,可以高效地计算和强调窗口中心附近的像素。)蓝色矩形移动了(u,v)。
接下来,您要计算标记为红色和蓝色的图像部分之间的平方差的总和,即,将它们逐像素相减,对差值求平方并求和(假设为简单起见,在我们要查找的区域中,窗口= 1在)。这为您提供了每个可能的(u,v)-> E(u,v)的一个数字。
让我们看看如果对不同的u / v值进行计算会发生什么:
首先保持v = 0:
这不足为奇:当图像部分之间的偏移(u,v)为0时,图像部分之间的差异最小。随着增加两个色块之间的距离,差异平方的总和也会增加。
保持u = 0:
该图看起来很相似,但是当您沿边缘方向移动蓝色矩形时,两个图像部分之间的平方差之和要小得多。
E(u,v)的完整图如下所示:
该图看起来有点像“峡谷”:如果将图像向峡谷方向移动,则只有很小的差异。这是因为此图像块具有主要的(垂直)方向。
我们可以对不同的图像补丁执行相同的操作:
在这里,E(u,v)的图看起来不同:
不管您以哪种方式移动补丁,它始终看起来都不同。
因此,函数E(u,v)的形状告诉我们有关图像补丁的一些信息
许多参考文献说,这是窗口“ w”移动的幅度...因此,窗口移动了多少?一个像素...两个像素?
通常,您根本不会计算E(u,v)。您只对(u,v)= {0,0)附近的形状感兴趣。因此,您只需要E(u,v)在(0,0)附近的泰勒展开式即可完全描述其“形状”。
窗口覆盖的像素位置上的总和是吗?
从数学上讲,让求和范围覆盖所有像素更为优雅。实际上,将窗口为0的像素相加没有任何意义。