Answers:
梯度下降法和共轭梯度法都是最小化非线性函数(即像Rosenbrock函数这样的函数)的算法
或多元二次函数(在这种情况下为对称二次项)
两种算法都是基于迭代和搜索方向的。在本文的其余部分,和将是长度为向量;和是标量,上标表示迭代索引。可以使用梯度下降和共轭梯度法来找到可求解的值d Ñ ˚F (X )α X *
两种方法都从初始猜测,然后使用以下形式的函数计算下一个迭代
换句话说,通过从当前位置并沿搜索方向移动一段距离,可以找到的下一个值。在两种方法中,移动距离可以由线搜索(发现最小化在)。也可以应用其他标准。两种方法的不同之处在于它们对的选择。对于梯度方法,。对于共轭梯度法,使用Grahm-Schmidt程序正交化梯度向量。特别是,但是等于X 我ð 我α 我 ˚F (X 我 + α 我ð 我)α 我ð 我ð 我 = - ∇ ˚F (X 我)d 0 = - ∇ ˚F (X 0)d 1 - ∇ ˚F (X 1)d 0(d 1 )T d 0 = 0减去该向量在上的投影,使得。每个随后的梯度矢量都与所有先前的梯度矢量正交,这为上面的二次函数提供了非常好的属性。
上面的二次函数(及相关公式)也是使用共轭梯度法求解的讨论的地方,因为的最小值在的点处实现。f (x )x A x = b