是否存在任何基于梯度下降的技术来搜索多维空间中函数的绝对最小值(最大值)?


11

我熟悉梯度下降算法,该算法可以找到给定函数的局部最小值(最大值)。

在函数具有多个局部极值的情况下,是否可以对梯度下降进行任何修改以找到绝对最小值(最大值)?

是否有通用的技术,如何增强可以找到局部极值的算法来找到绝对极值?


您可能需要检查交叉验证FAQ中链接的AI Q&A 。
卡夫

我认为这是梯度下降的缺点之一-它可能会卡在局部极值中。据我了解,模拟退火之类的其他技术可能不太容易受此影响,但仍不能保证。
2012年

1
我不确定“多维空间”与此有关。即使是R的函数也可能具有多个局部极值,梯度搜索将遇到问题。
Suresh Venkat 2012年

我非常确定,如果函数是连续的并且在足够的点上进行采样,则沿线有一个定理,您可以保证梯度下降将在某个点处找到全局最小值。即类似于鲍威尔算法的东西。文献如此丰富,以至于某个定理可能发表在某个地方,但还没有听说过。它还证明,随着采样的增加,局部优化可以在足够的采样下接近全局最优。
vzn

有点相关,也请参见此处的评论这些评论强烈认为全局NN或数值方法/启发式类型方法不是 “近似算法”
vzn 2012年

Answers:


17

我想您正在谈论无约束的最小化。您的问题应指定您是否正在考虑特定的问题结构。否则,答案是否定的。

首先,我应该消除一个神话。甚至不能保证经典的梯度下降法(也称为最速下降法)会找到局部极小值。当找到一阶临界点(即梯度消失的那个临界点)时,它停止。取决于要最小化的特定功能和起点,您很可能最终会到达鞍点甚至全局最大化器!

考虑例如和初始点。最陡的下降方向是。使用精确线搜索的方法的第一步使您位于梯度消失的。las,这是一个鞍点。您将通过检查二阶最优条件来实现。但是现在假设函数为。在这里,仍然是一个鞍点,但是从数值上讲,二阶条件可能无法告诉您。通常,假设您确定Hessian的特征值等于X 0ÿ 0= 1 0 - ˚F 1 0 = - 2 0 0 0 ˚F X y = x 210 16 y 2FXÿ=X2-ÿ2X0ÿ0:=1个0-F1个0=-2000FXÿ=X2-10-16ÿ22 ˚F X *ÿ002FXÿ-10-16。您如何阅读?是负曲率还是数值误差?如何?+10-16

现在考虑一个函数,例如

FX={1个如果 X0cosX如果 0<X<π-1个如果 Xπ

该函数非常平滑,但是如果您的初始点是,则算法将在全局最大化器处停止。通过检查二阶最优条件,您将不会知道!这里的问题是某些局部最小化器是全局最大化器!X0=-2

现在,实际上所有基于梯度的优化方法都受到设计的困扰。您的问题实际上是关于全局优化的问题。同样,答案是否定的,没有通用的方法可以修改方法,以确保识别出全局最小化器。只是问问自己:如果算法返回一个值并说它是一个全局最小化器,您将如何检查它是否正确?

全局优化中有几种方法。一些引入随机化。有些使用多启动策略。有些利用了问题的结构,但是这些是针对特殊情况的。找一本有关全局优化的书。您会喜欢的。


@罗马:非常欢迎。
Dominique

3

您的问题可能没有一刀切的答案。但是您可能希望研究模拟退火算法或其他依赖于马尔可夫链蒙特卡洛(MCMC)方法的方法。这些也可以与局部方法(例如梯度下降)结合使用。


1

关于“神经网络的全局优化”有很多参考。该技术类似于模拟退火[请参见其他答案]。基本思想是从许多不同的权重起点(随机或系统地采样)重新开始网络梯度下降。梯度下降的每个结果都像一个“样本”。抽取的样本越多,样本之一是全局最优的可能性就越高,尤其是如果目标函数在连续,微分等意义上“表现良好”。

在线裁判

[1] Hamm等人的神经网络权重全局优化

[2] 一种用于神经网络训练的全局优化方法 Voglis / Lagaris

[3] 通过全局优化 Pinter 校准人工神经网络

[4] 使用确定性混合方法 Beliakov 进行神经网络的全局优化

[5] 神经网络训练的全局优化 Shang / Wah


1

通常,很难在计算上优化多元非凸函数。硬度有不同的风味(加密,NP硬度)。看到这种情况的一种方式是,很难学习混合模型(例如,高斯或HMM的混合模型),但是,如果有可能有效地最大化可能性,则将很容易*。有关学习HMM硬度的结果,请参见 http://alex.smola.org/journalclub/AbeWar92.pdf http://link.springer.com/chapter/10.1007%2F3-540-45678-3_36 http:// www.math.ru.nl/~terwijn/publications/icgiFinal.pdf

(*)以非简并性和可识别性的通常条件为模


0

我必须不同意多米尼克。哈耶克(Hajek)在1980年代中期的研究表明,在一定严格条件下对非凸问题进行退火可以保证达到全局最小值:http : //dx.doi.org/10.1287/moor.13.2.311


2
根据上述硬度结果,这些条件确实必须非常严格!
Aryeh'2
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.