用于图像分类的非正方形图像


9

我有一个宽图像的数据集:1760x128。我已经阅读了教程和书籍,其中大多数都指出输入图像应为正方形,如果不是,则将它们转换为正方形以便在已经训练过的(在正方形图像上)cnns中进行训练。有没有一种方法可以为非正方形图像训练cnn,还是应该寻找其他选项作为填充?

Answers:


4

根据分类器,有几种解决问题的方法。滑动Windows是我最熟悉的方法,它用于神经网络方法。此方法涉及拍摄一个小的子图像,并在某些重叠的情况下上下移动它。一些问题包括找到最佳的移位参数和多尺度问题。

最终检测通常由分类器对每个子图像属于该类的信心程度来确定:例如多数表决,总可能性或距决策边界的总距离。我在下面列出了一些材料,第一个是关于HOG分类器方法的,但是概念是相同的。

  1. 对象检测滑动窗口
  2. 对象类别检测:滑动窗口
  3. 使用卷积网络进行过分集成的识别,定位和检测

2

如果您使用的是CNN,这根本不会造成任何问题。我制作了一个CNN来识别人脸,并且由于人脸通常宽度通常是人脸的70%,所以我使用了80x100像素的训练图像(如果头部倾斜,则稍微宽一些)。您的过滤器仍然应该是正方形。

所有这些变化将是现在您必须跟踪激活/合并地图的宽度和高度,而不仅仅是一个告诉您大小的值。例如 -

80 x 100的输入图像应用5 x 5卷积滤镜给出76 x 96的激活图应用2 x 2池化给出38 x 48的池化激活图

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.