对于Google来说,这对我来说是一个艰巨的主题,因为在搜索中使用“优化和随机”一词几乎会自动默认为搜索随机优化。但是,我真正想知道的是,当计算机模型输出是随机的(即不确定的)时,存在哪些方法可以优化计算机模型?
例如,如果您考虑一个计算机模型,其中有一些未知函数代表计算机模型的输出,那么存在许多用于解决问题的统计方法,例如
当是确定性的时。但是,当随机时会发生什么?有没有解决问题的方法,或者充其量只能解决
其中是通常的期望运算符。
对于Google来说,这对我来说是一个艰巨的主题,因为在搜索中使用“优化和随机”一词几乎会自动默认为搜索随机优化。但是,我真正想知道的是,当计算机模型输出是随机的(即不确定的)时,存在哪些方法可以优化计算机模型?
例如,如果您考虑一个计算机模型,其中有一些未知函数代表计算机模型的输出,那么存在许多用于解决问题的统计方法,例如
当是确定性的时。但是,当随机时会发生什么?有没有解决问题的方法,或者充其量只能解决
其中是通常的期望运算符。
Answers:
(将我的评论扩展为适当的答案。)
正如我提到的,这取决于您的目标。
期望值仅是优化目标的许多可能选择之一。例如,假设是正态分布的,则可以执行以下操作:f (x )
κ∈[Rκ>0κκ
通常,贝叶斯优化(BO,与高斯过程和kriging有关)处理昂贵的,有时嘈杂的函数评估。尽管文献的大部分焦点都集中在前一部分。您可以在此问题上找到有关贝叶斯优化的评论。
有人将BO应用于嘈杂的功能。作为该主题的简介,David Ginsbourger在全球优化的高斯过程研讨会(谢菲尔德,2015年9月17日)上作了题为“预期改进的变化”的精彩演讲。您可以在这里找到他的演讲,并且所有演讲都可以在此页面上找到(我也建议所有其他演讲作为对BO的出色一般介绍。)
作为参考,我将从Ginsbourger和同事以及Gramacy和同事所做的工作开始:
Picheny,V.和Ginsbourger,D.,2014年。“基于噪声的基于Kriging的优化方法:DiceOptim软件包中的统一实现”。计算统计与数据分析,71,第1035-1053页。(链接)
Picheny,V.,Ginsbourger,D.,Richet,Y.和Caplin,G.,2013年。“基于分位数的具有可调精度的嘈杂计算机实验优化”。Technometrics,55(1),第2-13页。(链接)
Grabacy,RB和Lee,HK,2012。“贝叶斯树状高斯过程模型及其在计算机建模中的应用”。美国统计协会杂志。(链接)
Grabacy,RB和Apley,DW,2015年。“大型计算机实验的局部高斯过程近似”。计算与图形统计杂志,24(2),pp.561-578。(链接)
Ginsburger和Gramacy都有R包,分别实现DiceOptim和tgp来实现其BO方法。
当前的答案集中在随机优化目标的正确(数学)定义上-我想提供一些更实用的观点。
当拟合随机模型时,例如使用非正式或综合可能性,该问题经常发生。参考文献(1)为您提供了一系列选项,可用于定义随机模型与数据之间的距离。
以这种方式定义了目标之后,剩下的问题就是找到某个嘈杂目标平均值的最佳方法。有两条路可走,a)优化,b)MCMC采样。您是在专门询问优化问题,但是我想引入MCMC,因为在执行此任务时,它们通常表现得更好。
a)如果您坚持进行优化,则需要确保您不会陷入困境,并且优化器可以处理随机目标。Matteo Fasiolo博士论文的第4章给出了一些提示,请参阅(2)。
b)正如我们在(1)中所指出的,MCMC通常对随机目标更为稳健-在噪声分布的温和条件下,MCMC会将噪声平均掉,并且采样目标与无噪声的目标将无法区分目标与噪声目标的平均值。但是,MCMC在遇到特别好的评估时也会卡住。您现在必须做的就是得到以下“显而易见”的想法:只需在每次MCMC迭代中计算当前值和建议值。在此处查找的关键字是“伪边际”,另请参见此处和此处。
1)Hartig,F .; 卡拉布雷斯(JM);Reineking,B .;Wiegand,T.&Huth,A.(2011)随机模拟模型的统计推论-理论与应用。Ecol。Lett。,14,816-827。
2)Fasiolo,M.(2016)复杂人口动态统计方法。巴斯大学
假设我们处于离散的概率空间中,因此。直观地,您需要一些函数以便可以优化。您只能优化一个目标! ù :- [R Ñ → [R ù (˚F (X ))
优化单个目标函数可能听起来很困难,但事实并非如此!相反,一个目标可以代表您对什么是更好或更坏的解决方案可能拥有难以置信的多样化偏好。
跳过之前,一个简单的开始可能是选择一个随机变量然后求解:
ë[˚F(X)]
您的问题是选择:
为了简化技术,我会说我们处于结果的离散概率空间中,因此我可以的向量来表示随机结果。
在某些技术条件下(从实际意义上讲不是限制性的),上述问题等同于最大化效用函数。(效用函数将更优先的结果分配给更高的数目。)
该逻辑适用于您选择导致多个结果变量的任何问题。
如果我们处于概率环境中并且接受Neumann-Morgernstern公理,则总效用函数必须采用特殊形式:
观察到简单情况使期望值最大化(即无风险规避)。
另一件事是:
直观地,您可以选择权重大于或小于状态出现的概率,这抓住了状态的重要性。p 我
这种方法的更深层理由是,在某些技术条件下,存在lambda权重,使得上述问题和更早的问题(例如,最大化)具有相同的解决方案。ù (˚F (X ))