Answers:
如果你有一个合理的黑森州近似,它是更好地使用它,而不是任意。
编辑:理由是,如果您开始接近解,则初始收敛速度是(对于任何)步线性,且步收敛因子为如果对于单位矩阵的某个秩r校正G,该值<1。因此,尝试将其减小到非常有价值。(这等效于对系统进行预处理。)收敛因子随时间提高,最终接近零(超线性收敛),但是在许多实际问题(尤其是高维问题)中,人们从来没有进行足够的迭代来达到超线性状态。因此,初始速度非常重要。
一种重要情况是求解非线性最小二乘问题(最小化)时,初始Hessian 的高斯-牛顿近似值可以是无需二阶导数即可进行计算。使用它使BFGS方法仿射不变,即在线性变换下像牛顿法一样不变。
另一个重要的情况是您解决了一系列相关问题。通常,使用上一个问题的最终Hessian近似值重新启动求解器会大大减少所需的迭代次数。