Answers:
偏置针对每个虚拟神经元进行操作,因此在有单个输出的情况下拥有多个偏置输入没有任何价值-等同于将不同的偏置权重加到单个偏置中。
在作为第一隐藏层输出的要素地图中,颜色不再保持分离*。实际上,每个特征图都是下一层中的“通道”,尽管通常在将输入与通道组合在一起的情况下将它们分别可视化。另一种思考方式是,原始图像中的单独RGB通道是输入中的3个“功能图”。
上一层中有多少个通道或要素都没有关系,下一层中每个要素图的输出是该图中的单个值。一个输出值对应于单个虚拟神经元,需要一个偏置权重。
正如您在问题中所解释的,在CNN中,在输出要素图中的每个点共享相同的权重(包括偏置权重)。因此,每个特征图都有自己的偏差权重和previous_layer_num_features x kernel_width x kernel_height
连接权重。
因此,是的,您的示例得出(3 x (5x5) + 1) x 32
的第一层权重总计对于CNN来说是正确的,而CNN的第一隐藏层将RGB输入到32个单独的特征图中。
*您可能会看到CNN 权重的可视化而感到困惑,可以将CNN 权重分为可操作的颜色通道。
CNN的特性是,它们使用共享的权重和偏差(同一层中所有隐藏神经元的权重和偏差相同)以检测相同的特征。与简单的神经网络相比,这导致了更深入的学习。您可以阅读此作为参考:
http://deeplearning.net/tutorial/lenet.html
http://neuralnetworksanddeeplearning.com/chap6.html#introducing_convolutional_networks