Answers:
反向传播是一种计算误差函数相对于权重的导数的方法,因此可以通过梯度下降优化方法来训练模型-基本上,这只是“链式规则”的应用。其实没有什么比这更多的了,因此,如果您对微积分感到满意,那基本上就是看待它的最佳方法。
如果您对微积分不满意,则更好的方法是说我们知道输出单元的工作状况,因为我们有一个期望的输出可用来与实际输出进行比较。但是我们没有隐藏单元的期望输出,那么我们该怎么办?反向传播规则基本上是一种将输出单元错误归咎于隐藏单元的方法。隐藏单元对特定输出单元的影响越大,该错误就应归咎于它。然后,与隐藏单元相关的总责备表示需要更改输入到隐藏层的权重。控制归咎于多少责任的两件事是连接隐藏层权重和输出层权重(显然)和隐藏单元的输出(如果是喊而不是窃窃私语,则可能会产生更大的影响)。剩下的只是数学上的细微之处,这些直觉将其转变为训练准则的派生。
我也建议主教书以适当的答案!; o)
这是一种用于训练前馈多层神经网络(多层感知器)的算法。网上有几个不错的Java小程序,它们说明了正在发生的事情,例如:http : //neuron.eng.wayne.edu/bpFunctionApprox/bpFunctionApprox.html。另外,Bishop的关于NN的书是与NN相关的标准桌面参考。