无监督图像分割


10

我正在尝试实现一种算法,其中给定一个在平面表上具有多个对象的图像,期望的是每个对象的分割蒙版的输出。与CNN不同,这里的目标是在陌生的环境中检测物体。解决此问题的最佳方法是什么?另外,在线上有任何实施示例吗?

编辑:很抱歉,问题可能有点误导。我所说的“陌生环境”的意思是算法可能不知道对象。该算法不需要了解对象是什么,而应该仅检测对象。我应该如何解决这个问题?


“与CNN不同”没有任何意义;CNN是一种模型,而不是一种具有目标的任务。无监督图像分割也可以使用CNN来完成
Nathan

Answers:


4

快速的回应

均值漂移LSH这是一个升级O(n)在著名的均值平移算法的也知道它的图像分割能力O(n2)

一些解释

KO(n)K-方法失败是因为它是设计用来寻找椭圆形簇而不是随机形状的簇。

在相反的位置,我们具有均值漂移(Mean Shift)功能,它可以自动查找具有随机形状的簇的数量-当您不知道所寻找的内容时很有用。

KK

图像分割聚类的建议

将您的色彩空间从RGB转换为LUV,更适合于欧式距离。

K

  • O(α.n)
  • O(β.n)
  • α>β

Mean Shift LSH较慢,但更适合您的需求。它保持线性不变,并且可以通过上述实现进行扩展

PS:我的个人资料图片是Mean Shift LSH在我自己身上的一种应用,如果它可以帮助您确定其工作原理,则可以使用。


3

您可能需要看一下提交给CVPR 2018并接受的这项工作:学习对每件事进行细分

在这项工作中,他们尝试对所有内容进行细分,甚至是网络不知道的对象。Mask R-CNN已被使用,并结合了转移学习子网,它们在分割几乎所有内容时都取得了很好的效果。


2

最先进的图像分割(SOTA)将是Facebook的Mask-RCNN

虽然通常在具有真实对象的数据集(例如COCOPascal)上对其进行训练,但是您可以在自己选择的数据集上对它进行重新训练,无论是否真实。

Facebook提供了Apache2许可下的实现(Detectron)。试试看!


实际上,我想我以一种误导性的方式提出了这个问题,我很糟糕。我刚刚发布了修改,您可以再看一遍吗?
MuhsinFatih '18

2

实际上,您的任务是受监督的。Segnet可以是出于您目的的良好体系结构,可以在这里访问其实现之一。SegNet通过监督学习来学习预测像素类标签。因此,我们需要输入图像的数据集以及相应的地面真相标签。标签图像必须是单通道,每个像素都用其类别...标记

另外,请看完全适合您的任务的全卷积网络


根据问题中的修改,我添加了其他信息。有许多方法可用于此任务。基本上,最简单的方法是使用背景标签,并通过采用上述体系结构将您不知道的那些类分类为背景。这样,您的标签可能会与背景类重叠,这可能是此方法的缺点,但是它的优点是,如果您在输入中频繁使用训练有素的标签,则可以使用相对较轻的架构,识别未知的类。


实际上,我想我以一种误导性的方式提出了这个问题,我很糟糕。我刚刚发布了修改,您可以再看一遍吗?
MuhsinFatih '18

@MuhsinFatih已编辑。
媒体

如果这是有监督的任务,那肯定会更容易,并且可以获得更好的性能,但是无监督的图像分割也是可能的。
内森

@Nathan当时我已经提出了自己的看法。绝对有可能。
媒体

1

这可能是您正在寻找的东西。由于您要求的是图像分割而不是图像分割semantic / instance,因此我认为您不需要为图像中的每个片段添加标签。

该方法称为scene-cut以无监督的方式将图像分割为类无关的区域。在室内杂乱的环境下,这非常有效。

论文链接:arxiv

代码:代码

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.