为什么卷积总是使用奇数作为filter_size


13

如果我们看一下使用CNN(ConvNet)发表的论文中有90-99%。他们中的绝大多数使用奇数号的过滤器大小:{1、3、5、7}最常用。

这种情况可能会导致一些问题:使用这些滤波器大小时,通常在填充为2(普通填充)的情况下卷积运算并不完美,并且在此过程中会丢失input_field的某些边缘...

问题1:为什么仅对卷积滤波器大小使用奇数?

Question2:在卷积过程中忽略一小部分input_field实际上是一个问题吗?为什么这样/不呢?

Answers:


14

简单地说,卷积运算是两个矩阵的按元素乘积的组合。只要这两个矩阵在维数上一致,就不会有问题,因此我可以理解您查询背后的动机。

A.1。但是,卷积的目的是按照过滤器或内核对源数据矩阵(整个图像)进行编码。更具体地说,我们正在尝试对锚点/源像素附近的像素进行编码。看一下下图: 在此处输入图片说明 通常,我们将源图像的每个像素都视为锚点/源像素,但是我们不受此限制。实际上,包括跨度并不罕见,在这种跨度中,锚点/源点像素之间被特定数量的像素分开。

好吧,那么源像素是什么?它是内核居中的锚点,我们正在编码所有相邻像素,包括锚/源像素。由于内核是对称形状的(内核值不是对称的),因此锚像素的所有侧面(4-连通性)上的像素数均相等(n)。因此,无论该像素数量多少,对称形状内核的每一侧的长度均为2 * n + 1(锚的每一侧+锚像素),因此过滤器/内核的大小始终为奇数。

如果我们决定打破“传统”并使用非对称内核怎么办?您会遇到锯齿错误,因此我们不这样做。我们认为像素是最小的实体,即此处没有子像素的概念。

A.2使用不同的方法来处理边界问题:有人忽略了它,有人零填充了它,有些镜面了。如果您不打算计算逆运算(即反卷积)并且对完美重建原始图像不感兴趣,那么您就不必担心由于边界问题而导致的信息丢失或噪声注入。通常,合并操作(平均合并或最大合并)将始终删除边界工件。因此,请随意忽略“输入字段”的一部分,您的池化操作将为您做到这一点。

-

卷积的禅宗:

在老式信号处理域中,当对输入信号进行卷积或通过滤波器时,无法先判断卷积/滤波响应的哪些成分是相关的/信息性的,哪些不是。因此,目的是在这些转换中保留信号分量(所有信号分量)。

这些信号成分是信息。有些组件比其他组件提供更多信息。这样做的唯一原因是我们对提取更高级别的信息感兴趣。与某些语义类有关的信息。因此,可以删除那些不提供我们特别感兴趣的信息的信号分量。因此,与关于卷积/过滤的老式教条不同,我们可以随意收集/修剪卷积响应。我们认为这样做的方式是严格删除所有对改善我们的统计模型没有帮助的数据成分。


谢谢您的大赞,但是通过用数学术语看卷积的定义难道不容易理解吗? zh_cn.wikipedia.org/wiki/Convolution#Discrete_convolution 因为在这里我们看到在原点的左边和右边总是有m个项……因此,这将始终导致数量不均衡。
zwep

@zwep同意!问答论坛不能取代百科全书;但只是补充它们。但是,您可以从更广泛的角度来评论:定义通常只是经过同行评审的可用选项中的最佳选择。这不是福音真理。尽管如此,在打破规则之前必须先学习规则,以便可以将如何以及为什么以不同的方式向社区明确传达规则。某种定义背后的原因和替代选择出现在研究论文中,而通常不在百科全书中。
Dynamic Stardust

5

1)假设input_field全为零,但index处只有一个idx。奇数的过滤器大小将返回以峰值为中心的数据idx,而偶数的过滤器大小将不会返回-考虑大小为2的均匀过滤器的情况。大多数人在过滤时希望保留峰的位置。

2)所有input_field都与卷积有关,但output_field由于所需数据未包含在中,因此无法精确计算的边缘input_field。如果我想计算的第一个元素的答案output_field,则过滤器必须以的第一个​​元素为中心input_field。但是,有些过滤器元素不对应于的任何可用元素input_field。有很多技巧可以猜测的边缘output_field


2

对于奇数大小的滤波器,所有先前的层像素将在输出像素周围对称。如果没有这种对称性,我们将不得不考虑使用均匀大小的内核时发生的跨层失真。因此,通常会跳过偶数大小的内核过滤器,以简化实现。如果将卷积视为从给定像素到中心像素的插值,则无法使用偶数大小的滤镜将其插值到中心像素。

为什么偶数大小的过滤器不起作用

来源:https : //towardsdatascience.com/deciding-optimal-filter-size-for-cnns-d6f7b56f9363

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.