关于如何规范化图像有一些变体,但大多数似乎使用以下两种方法:
- 减去在所有图像上计算出的每个通道的平均值(例如 VGG_ILSVRC_16_layers)
- 通过对所有图像计算的像素/通道相减(例如CNN_S,另请参见Caffe的参考网络)
在我看来,自然的方法是将每个图像标准化。在宽广的日光下拍摄的图像比夜间拍摄的图像会引起更多的神经元放电,虽然它可以告诉我们时间,但我们通常关心的是边缘等处出现的更有趣的特征。
Pierre Sermanet在3.3.3中指出,局部对比度归一化将基于每个图像,但是我在所见过的任何示例/教程中都没有遇到过。我也看到了一个有趣的Quora问题和WeiXu-Shen Wei的帖子,但是他们似乎并不支持上述两种方法。
我到底在想什么?这是颜色归一化问题还是有一篇论文可以真正解释为什么这么多人使用这种方法?