用于图像分类的非正方形图像

9

我有一个宽图像的数据集：1760x128。我已经阅读了教程和书籍，其中大多数都指出输入图像应为正方形，如果不是，则将它们转换为正方形以便在已经训练过的（在正方形图像上）cnns中进行训练。有没有一种方法可以为非正方形图像训练cnn，还是应该寻找其他选项作为填充？

conv-neural-network

— 沃伊拉
source

4

根据分类器，有几种解决问题的方法。滑动Windows是我最熟悉的方法，它用于神经网络方法。此方法涉及拍摄一个小的子图像，并在某些重叠的情况下上下移动它。一些问题包括找到最佳的移位参数和多尺度问题。

最终检测通常由分类器对每个子图像属于该类的信心程度来确定：例如多数表决，总可能性或距决策边界的总距离。我在下面列出了一些材料，第一个是关于HOG分类器方法的，但是概念是相同的。

— 约瑟夫·桑塔坎格洛
source

2

如果您使用的是CNN，这根本不会造成任何问题。我制作了一个CNN来识别人脸，并且由于人脸通常宽度通常是人脸的70％，所以我使用了80x100像素的训练图像（如果头部倾斜，则稍微宽一些）。您的过滤器仍然应该是正方形。

所有这些变化将是现在您必须跟踪激活/合并地图的宽度和高度，而不仅仅是一个告诉您大小的值。例如 -

80 x 100的输入图像应用5 x 5卷积滤镜给出76 x 96的激活图应用2 x 2池化给出38 x 48的池化激活图

— 机器人
source