图像配准算法通常基于点特征,例如SIFT(尺度不变特征变换)。
我看到了一些有关线要素的参考,但是我想知道是否可以匹配图像段而不是点。例如,给定的源和转换后的图像:
我可以对每个像素进行边缘检测,模糊和分水岭变换:
遗憾的是,在每个图像上的分割结果差异太大,无法匹配各个段。
我看到了一些关于匹配形状和形状描述符的论文,这些关系对于仿射变换是不变的,所以这个领域似乎很有希望...
是否存在任何更鲁棒的仿射(甚至射影)图像变形方法?
图像配准算法通常基于点特征,例如SIFT(尺度不变特征变换)。
我看到了一些有关线要素的参考,但是我想知道是否可以匹配图像段而不是点。例如,给定的源和转换后的图像:
我可以对每个像素进行边缘检测,模糊和分水岭变换:
遗憾的是,在每个图像上的分割结果差异太大,无法匹配各个段。
我看到了一些关于匹配形状和形状描述符的论文,这些关系对于仿射变换是不变的,所以这个领域似乎很有希望...
是否存在任何更鲁棒的仿射(甚至射影)图像变形方法?
Answers:
MSER(最大稳定的末梢区域)是区域,而不是点。它们对于仿射变换是不变的。严格来说,这不是分割方法
非正式地讲,该想法是找到处于各种阈值的斑点,然后选择在一定阈值范围内形状/区域变化最小的斑点。这些区域对于较大范围的灰度和几何变换应该是稳定的。
我目前正在使用Component Trees进行CBIR ,这应该是一个相对较新的想法。使用组件树描述图像的一些预期优势将是:
当我刚开始与该主题相关的研究时,我对我的目标只有一个模糊的想法:用分量树表示图像,然后比较所述的分量树,或者直接通过找到矢量化表示来进行比较。我可能会在几周(或几个月)后说更多话,但是现在我只能提供推荐给我的论文列表作为组件树的介绍(我尚未阅读):
如果可以找到相关的内容,我也许可以更新答案。
另外,如果您的目标是以某种方式更准确地匹配图像区域而不是仅是点,因为区域可能更具区分性,那么在J. Sivic和A. Zisserman中提出了一个很好的建议:“视频Google:文本检索视频中对象匹配的方法”。
我指的是涉及空间一致性的部分,其中仅当特征点在两个图像中都保持相似的空间配置时,才接受一组特征点之间的匹配。因此,匹配不仅取决于提取的特征的类型(DoG,MSER等)还是描述符(SIFT),而且还着眼于特征点的较宽环境,从而使其(至少一点)取决于地区。