在一些教程中,我发现有人说“ Xavier”权重初始化(论文:了解训练深度前馈神经网络的难度)是初始化神经网络权重的有效方法。
对于完全连接的层,这些教程中有一条经验法则:
其中是图层的权重方差,使用正态分布进行初始化,,是父图层和当前图层中神经元的数量。ñ 我ñ Ñ Ò ù 吨
卷积层有类似的经验法则吗?
我正在努力找出最适合初始化卷积层权重的方法。例如在权重形状为的层中(5, 5, 3, 8)
,即内核大小为5x5
,过滤三个输入通道(RGB输入)并创建8
特征图...是否将被3
视为输入神经元的数量?或者说75 = 5*5*3
,因为输入是5x5
每个颜色通道的色标?
我既可以接受一个明确的问题答案,也可以接受一个更“通用”的答案,这可以解释找到正确的权重初始化并最好链接源的一般过程。