求解Hamilton-Jacobi-Bellman方程;最佳化所必需和充分的?


13

考虑下面的微分方程 其中 是状态,u是控制变量。该解决方案由 \ begin {align} x(t)= x_0 + \ int ^ t_0f(x(s),u(s))ds给出。\ end {align} ,其中x_0:= x(0)是给定的初始状态。 Xù X = X 0 + 0 ˚F X 小号ù 小号d 小号x0=x0

x˙(t)=f(x(t),u(t))
xu
x(t)=x0+0tf(x(s),u(s))ds.
x0:=x(0)

现在考虑以下程序

V(x0):=maxu0eρtF(x(t),u(t))dts.t. x˙(t)=f(x(t),u(t))x(0)=x0
其中ρ>0表示时间偏好,V()是值,F()一个目标函数。经典的经济应用是最优增长的Ramsey-Cass-Koopmans模型。Hamilton-Jacobi-Bellman方程由
ρV(x)=maxu[F(x,u)+V(x)f(x,u)],t[0,).

说我已经解决了V的HJB V。然后由\ begin {align} u ^ * = \ arg \ max_u [F(x,u)+ V'(x)f(x,u)]给出最佳控制 \ end {align}

u=argmaxu[F(x,u)+V(x)f(x,u)].
我将获得状态和控制\ {(x ^ *(t),u ^ *(t)):t \ in [0,\ infty)\}的最佳轨迹{(x(t),u(t)):t[0,)}

维基文章说

...但是在整个状态空间上求解时,HJB方程是实现最佳状态的必要和充分条件。

他在Bertsekas(2005)的《动态规划与最优控制》(第1卷,第3版)中,在命题3.2.1中指出,求解V是最优的成本函数,而相关的u是最优的。但是,他明确声明它是一个充分性定理。

实际上,我只想确保,如果我已经解决了HJB并恢复了相关的状态和控制轨迹,那么我不必担心任何其他的最优性条件。

我尝试

我认为我能够通过HJB方程本身从最大原理中得出必要条件。

定义哈密尔顿

H(x,u,V(x)):=F(x,u)+V(x)f(x,u)

那么我们有

ρV(x)=maxuH(x,u,V(x))

这是

ρV(x)=H(x,u,V(x)).

用定义任意函数。现在修复 q:[0,)Rq(0)=limtq(t)=0

x=x+εq

其中是一个参数。将项插入最大化的哈密顿,得到 εR

ρV(x+εq)=H(x+εq,u,V(x+εq)).

在我们有最佳解决方案。因此,对求微分以获得一阶条件 ε=0ε

ρVq=Hxq+HVVq.

现在,用定义伴随变量

λ=V(x).

随时间区分

λ˙=Vx˙.

并注意

HV=f(x,u)=x˙.

将所有内容插入到焦点中,得到

ρλ=Hx+λ˙.

差不多了。因此,解决HJB确实是必要且充分的(此处省略)以实现最佳性。有人应该将其添加到Wiki。可能会为思考此类问题的人们节省时间(我认为不会太多)。

但是 缺少横向条件 。

limteρtλ(t)=0

II尝试

定义收益函数

J(u):=0eρtF(x,u)dt

注意 通过定义。将中性项添加到收益函数

0eρtλ[f(x,u)x˙]dt=0
x˙=f(x,u)
J(u)=0eρt[F(x,u)+λf(x,u)]dt0eρtλx˙dt=0eρtH(x,u,λ)0eρtλx˙dt

在按右项的一部分进行积分可以得出

0eρtλx˙dt=[eρtλ(t)x(t)]00eρtx(λ˙ρλ)dt

重新替换该术语

J(u)=0eρt[H(x,u,λ)+x(λ˙ρλ)]dtlimteρtλ(t)x(t)+λ(0)x(0)

定义

x=x+εqu=u+εp

给出

J(ε)=0eρt[H(x+εq,u+εp,λ)+(x+εq)(λ˙ρλ)]dtlimteρtλ(t)[x(t)+εq(t)]+λ(0)x(0)

最大Jε=0

Jε=0eρt[Hxq+Hup+q(λ˙ρλ)]dtlimteρtλ(t)q(t)=0

由于和是不受约束的,因此我们必须 qp

Hu=0Hx=ρλλ˙limteρtλ(t)=0

您确定必要的充分条件了吗?
Jamzy

在什么经济背景下会出现这种情况?
Stan Shunpike,2015年


1
我认为此线程更适合math.stackexchange.com,因为它并未真正链接到econ。一个mod可以转移它。
笨拙的2015年

我不确定在这里问什么:如果按照Bertsekas的要求解决HJB就足够了,那么您不必“担心其他的最优性条件”。如果没有解决HJB,则会出现“仅足够”而不是“必要和足够”的情况-在这种情况下,人们会说“这并不意味着没有解决方案”。顺便说一句,您的尝试I和II是有价值的内容-第一个显示HJB和最优控制之间的链接,第二个显示如何导出最优控制FOC。
Alecos Papadopoulos 2015年

Answers:


1

(这也许应该被视为评论。)

如果您已经解决了HJB方程,则足以获得最佳解决方案。因此,您不必“不必担心任何其他最优条件”,我相信这似乎可以回答您的问题。

看来您担心定理的“必要”部分。该陈述的必要性如下:如果存在最优解,则必须存在HJB方程的解。

我没有解决这个特定的问题,但是总的来说,答案是我们不希望有一个微分函数V。因此,对于方程式,我们没有解决方案。相反,我们需要查看广义导数,并将HJB方程转换为不等式。在这种情况下,您可能会获得“粘度解决方案”。如果扩展到使用广义导数,则有可能证明这样的解决方案始终存在。看看您的证据,它们对必要条件没有帮助,因为您假设自己具有差异性。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.