您走在正确的轨道上。
不变性意味着即使对象的外观以某种方式变化,也可以将其识别为对象。这通常是一件好事,因为它可以在视觉输入的细节变化中保留对象的身份,类别等,例如查看器/摄像机与对象的相对位置。
下图包含同一雕像的许多视图。您(以及训练有素的神经网络)可以识别出同一对象出现在每张图片中,即使实际像素值完全不同。
请注意,这里的翻译在视觉上具有特定的含义,是从几何学借来的。它不涉及任何类型的转换,不像从法语到英语或文件格式之间的转换。相反,这意味着图像中的每个点/像素已沿相同方向移动了相同的量。或者,您可以认为原点已在相反方向上偏移了相等的量。例如,我们可以通过将每个像素向右移动50或100个像素,从第一行生成第一行的第二张和第三张图像。
可以证明卷积算子相对于平移是可交换的。如果将与卷积,则转换平移后的输出或先转换或然后对其进行卷积都没关系。维基百科还有
更多。
fgf∗gfg
翻译不变的对象识别的一种方法是获取对象的“模板”,并将其与图像中对象的每个可能位置进行卷积。如果您在某个位置获得了较大的响应,则表明与模板相似的对象位于该位置。这种方法通常称为模板匹配。
不变性与等方差
Santanu_Pattanayak的答案(点击这里)指出,有翻译之间的差异不变性和平移同变性。平移不变性意味着无论输入如何移位,系统都会产生完全相同的响应。例如,面部检测器可能会在第一行中报告所有三张图像的“面部图像”。等方差意味着系统在各个位置上均能很好地工作,但是其响应随目标位置而变化。例如,“面部表情”的热图在处理第一行图像时在左侧,中央和右侧将具有相似的凸起。
有时这是一个重要的区别,但是很多人都将这两种现象称为“不变性”,特别是因为将等变响应转换为不变的响应通常是微不足道的-只需忽略所有位置信息即可。