Answers:
这个领域本身太广阔了。因此,我怀疑您是否可以在此列出所有清单。但是,MPEG 7是对该领域进行标准化的主要工作之一。因此,此处包含的内容不是通用的-至少是最主要的。
以下是其在MPEG-7(我真的可以只谈视觉描述符的不是别人看到确定一些关键的功能设置这个全范围)。
视觉描述符有4类:
1. 颜色描述符,包括:
主要颜色,
颜色布局(基本上逐块地
原色),可扩展颜色(基本上是颜色直方图),
颜色结构(基本上是本地颜色直方图)
和使空间可互操作的颜色空间。
2. 纹理描述符(另请参阅此),其中包括:
纹理浏览描述符-定义粒度/粗度,规则性和方向。均匀纹理描述符-基于Gabor滤波器组。和
边缘直方图
3. 形状描述符,包括:
基于区域的描述符是所考虑形状的标量属性-例如面积,离心率等。
基于轮廓的捕获实际特征形状特征和
3D描述符
4.
摄像机运动的运动描述符(3-D摄像机运动参数)
(场景中物体的运动轨迹)[例如,通过跟踪算法提取] [运动]参数运动(例如,运动矢量,它允许描述场景的运动。但是可以是各种对象的更复杂模型)。
活动更多是语义描述符。
MPEG 7并未定义“如何提取这些内容”,它仅定义了它们的含义以及如何表示/存储它们。因此,确实存在有关如何提取和使用它们的研究。
这是另一篇很好的论文,它提供了对该主题的见解。
但是,是的,其中许多功能是相当基本的,可能需要更多的研究才能创建更复杂(更复杂)的功能集。
好的,我认为我通过搜索更多内容找到了合适的列表。有Deselaers等人的论文。哪个接缝就是我想要的!
还有一本书,捆绑了与此主题相关的一组论文。这就是所谓的视觉信息检索原理。
@Dipan Mehta 介绍了可以使用的功能描述符。现在让我尝试通过提及一些特征检测方法来掩盖硬币的另一面,这些方法提取出对CBIR有用的特征。
我对CBIR研究的参考是Sivic,Zisserman和Nister ,Stewenius的论文。这些作者提供了更多的最新论文,但是这些论文提出了所有相关的想法。
他们认为,要实施有效的CBIR方法,应使用互补特性的特征:
形状适应区域 -倾向于以拐角状特征为中心
示例: 哈里斯角点,多尺度哈里斯点,DoG(高斯的差异-但对边缘也有反应!)
最大稳定区域 -倾向于以斑点状特征为中心
示例: MSER(最大稳定的外部区域),DoG
令人惊讶的是,Wikipedia还提供了特征(检测器)类型的良好分类,说明了它们针对大多数当前广泛使用的特征检测到的兴趣区域的类型:
我最近阅读的大多数最新文章都发誓,SIFT(尺度不变特征变换)描述符会摇摆不定,并且足够强大,可以与所选特征检测器结合使用。参考资料包括:
注意!这些论文并未严格涉及CBIR,但在CBIR相关工作中被用作参考。
最后,值得一提的是,成功的CBIR方法不仅取决于所使用的特征检测器和描述符,还取决于:
另外,我已经回答了有关的一些问题CBIR对DSP和计算器,两者都伴随着引用和解释,我认为他们可能是相关的,所以你可能想看一看: