用于基于内容的图像检索的可能图像功能列表


15

我试图找到可能的图像特征的列表,例如颜色,取向的边缘等,以测量在图像中找到相同/相似对象时的可用性。有谁知道这样的列表或至少一些功能?


这超出了主题,但是CBIR可以从Open Image数据集中提取特征吗?即使图像未保存在本地磁盘中,也可以提取图像的特征吗?
Quix0te

Answers:


25

这个领域本身太广阔了。因此,我怀疑您是否可以在此列出所有清单。但是,MPEG 7是对该领域进行标准化的主要工作之一。因此,此处包含的内容不是通用的-至少是最主要的。

以下是其在MPEG-7(我真的可以只谈视觉描述符的不是别人看到确定一些关键的功能设置这个全范围)。

视觉描述符有4类:

1. 颜色描述符,包括:
主要颜色,
颜色布局(基本上逐块地
原色),可扩展颜色(基本上是颜色直方图),
颜色结构(基本上是本地颜色直方图)
和使空间可互操作的颜色空间。

2. 纹理描述符(另请参阅),其中包括:
纹理浏览描述符-定义粒度/粗度,规则性和方向。均匀纹理描述符-基于Gabor滤波器组。和
边缘直方图

3. 形状描述符,包括:
基于区域的描述符是所考虑形状的标量属性-例如面积,离心率等。
基于轮廓的捕获实际特征形状特征和
3D描述符

4.
摄像机运动的运动描述符(3-D摄像机运动参数)
(场景中物体的运动轨迹)[例如,通过跟踪算法提取] [运动]参数运动(例如,运动矢量,它允许描述场景的运动。但是可以是各种对象的更复杂模型)。
活动更多是语义描述符。


MPEG 7并未定义“如何提取这些内容”,它仅定义了它们的含义以及如何表示/存储它们。因此,确实存在有关如何提取和使用它们的研究。

这是另一篇很好的论文,它提供了对该主题的见解。

但是,是的,其中许多功能是相当基本的,可能需要更多的研究才能创建更复杂(更复杂)的功能集。



6

还有一本书,捆绑了与此主题相关的一组论文。这就是所谓的视觉信息检索原理


谷歌搜索这些书并没有得到很多正面的评价。实际上,抱怨多于积极。您是否仍然认为这是一个很好的参考,如果这样,也许您可​​以告诉我们何时对您有用?:)
penelope 2012年

放在这里的主要原因不是我经常使用它,而是我的老师推荐的(我很看重他的观点)。谷歌搜索它表明它实际上是一堆文件,而不是一本书。它也显示了它相当古老的内容,但仍是有关该主题的少数书籍之一。因此,我认为我的答案仍然合适。
Geerten

3

@Dipan Mehta 介绍了可以使用的功能描述符。现在让我尝试通过提及一些特征检测方法来掩盖硬币的另一面,这些方法提取出对CBIR有用的特征

我对CBIR研究的参考是Sivic,ZissermanNister ,Stewenius的论文。这些作者提供了更多的最新论文,但是这些论文提出了所有相关的想法。

他们认为,要实施有效的CBIR方法,应使用互补特性的特征:

  • 形状适应区域 -倾向于以拐角状特征为中心

    示例: 哈里斯角点,多尺度哈里斯点,DoG(高斯的差异-但对边缘也有反应!)

  • 最大稳定区域 -倾向于以斑点状特征为中心

    示例: MSER(最大稳定的外部区域),DoG

令人惊讶的是,Wikipedia还提供了特征(检测器)类型的良好分类,说明了它们针对大​​多数当前广泛使用的特征检测到的兴趣区域的类型:

  • 边缘检测器
  • 角落探测器
  • 斑点检测器
  • 脊形探测器

我最近阅读的大多数最新文章都发誓,SIFT(尺度不变特征变换)描述符会摇摆不定,并且足够强大,可以与所选特征检测器结合使用。参考资料包括:

注意!这些论文并未严格涉及CBIR,但在CBIR相关工作中被用作参考。

最后,值得一提的是,成功的CBIR方法不仅取决于所使用的特征检测器描述符,还取决于:

  • 高效的搜索结构(视觉特征的量化)
  • 构造图像描述符的方法 -基于常见的视觉特征(局部描述符),或者通过比较全局图像描述符(这是一个非常新的想法,因此目前没有引用)
  • 图像描述符之间的距离度量

另外,我已经回答了有关的一些问题CBIRDSP计算器,两者都伴随着引用和解释,我认为他们可能是相关的,所以你可能想看一看:

  • DSP:1
  • 计算器:12
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.