9 我有一个宽图像的数据集:1760x128。我已经阅读了教程和书籍,其中大多数都指出输入图像应为正方形,如果不是,则将它们转换为正方形以便在已经训练过的(在正方形图像上)cnns中进行训练。有没有一种方法可以为非正方形图像训练cnn,还是应该寻找其他选项作为填充? conv-neural-network — 沃伊拉 source
4 根据分类器,有几种解决问题的方法。滑动Windows是我最熟悉的方法,它用于神经网络方法。此方法涉及拍摄一个小的子图像,并在某些重叠的情况下上下移动它。一些问题包括找到最佳的移位参数和多尺度问题。 最终检测通常由分类器对每个子图像属于该类的信心程度来确定:例如多数表决,总可能性或距决策边界的总距离。我在下面列出了一些材料,第一个是关于HOG分类器方法的,但是概念是相同的。 对象检测滑动窗口 对象类别检测:滑动窗口 使用卷积网络进行过分集成的识别,定位和检测 — 约瑟夫·桑塔坎格洛 source
2 如果您使用的是CNN,这根本不会造成任何问题。我制作了一个CNN来识别人脸,并且由于人脸通常宽度通常是人脸的70%,所以我使用了80x100像素的训练图像(如果头部倾斜,则稍微宽一些)。您的过滤器仍然应该是正方形。 所有这些变化将是现在您必须跟踪激活/合并地图的宽度和高度,而不仅仅是一个告诉您大小的值。例如 - 80 x 100的输入图像应用5 x 5卷积滤镜给出76 x 96的激活图应用2 x 2池化给出38 x 48的池化激活图 — 机器人 source