考虑下面的微分方程
其中 是状态,u是控制变量。该解决方案由
\ begin {align} x(t)= x_0 + \ int ^ t_0f(x(s),u(s))ds给出。\ end {align}
,其中x_0:= x(0)是给定的初始状态。 Xù X (吨)= X 0 + ∫ 吨0 ˚F (X (小号),ù (小号))d 小号。x0:=x(0)
x˙(t)=f(x(t),u(t))
xux(t)=x0+∫t0f(x(s),u(s))ds.
x0:=x(0)
现在考虑以下程序
s.t. V(x0):=maxu∫∞0e−ρtF(x(t),u(t))dtx˙(t)=f(x(t),u(t))x(0)=x0
其中
ρ>0表示时间偏好,
V(⋅)是值,
F(⋅)一个目标函数。经典的经济应用是最优增长的Ramsey-Cass-Koopmans模型。Hamilton-Jacobi-Bellman方程由
ρV(x)=maxu[F(x,u)+V′(x)f(x,u)],∀t∈[0,∞).
说我已经解决了V的HJB V。然后由\ begin {align} u ^ * = \ arg \ max_u [F(x,u)+ V'(x)f(x,u)]给出最佳控制
。\ end {align}
u∗=argmaxu[F(x,u)+V′(x)f(x,u)].
我将获得状态和控制
\ {(x ^ *(t),u ^ *(t)):t \ in [0,\ infty)\}的最佳轨迹
{(x∗(t),u∗(t)):t∈[0,∞)}。
在维基文章说
...但是在整个状态空间上求解时,HJB方程是实现最佳状态的必要和充分条件。
他在Bertsekas(2005)的《动态规划与最优控制》(第1卷,第3版)中,在命题3.2.1中指出,求解V是最优的成本函数,而相关的u∗是最优的。但是,他明确声明它是一个充分性定理。
实际上,我只想确保,如果我已经解决了HJB并恢复了相关的状态和控制轨迹,那么我不必担心任何其他的最优性条件。
解
我尝试
我认为我能够通过HJB方程本身从最大原理中得出必要条件。
定义哈密尔顿
H(x,u,V′(x)):=F(x,u)+V′(x)f(x,u)
那么我们有
ρV(x)=maxuH(x,u,V′(x))
这是
ρV(x)=H(x,u∗,V′(x)).
用定义任意函数。现在修复
q:[0,∞)→Rq(0)=limt→∞q(t)=0
x=x∗+εq
其中是一个参数。将项插入最大化的哈密顿,得到
ε∈R
ρV(x∗+εq)=H(x∗+εq,u∗,V′(x∗+εq)).
在我们有最佳解决方案。因此,对求微分以获得一阶条件
ε=0ε
ρV′q=Hxq+HV′V′′q.
现在,用定义伴随变量
λ=V′(x).
随时间区分
λ˙=V′′x˙.
并注意
HV′=f(x,u)=x˙.
将所有内容插入到焦点中,得到
ρλ=Hx+λ˙.
差不多了。因此,解决HJB确实是必要且充分的(此处省略)以实现最佳性。有人应该将其添加到Wiki。可能会为思考此类问题的人们节省时间(我认为不会太多)。
但是
缺少横向条件
。
limt→∞e−ρtλ(t)=0
II尝试
定义收益函数
J(u):=∫∞0e−ρtF(x,u)dt
注意
通过定义。将中性项添加到收益函数
∫∞0e−ρtλ[f(x,u)−x˙]dt=0
x˙=f(x,u)J(u)=∫∞0e−ρt[F(x,u)+λf(x,u)]dt−∫∞0e−ρtλx˙dt=∫∞0e−ρtH(x,u,λ)−∫∞0e−ρtλx˙dt
在按右项的一部分进行积分可以得出
∫∞0e−ρtλx˙dt=[e−ρtλ(t)x(t)]∞0−∫∞0e−ρtx(λ˙−ρλ)dt
重新替换该术语
J(u)=∫∞0e−ρt[H(x,u,λ)+x(λ˙−ρλ)]dt−limt→∞e−ρtλ(t)x(t)+λ(0)x(0)
定义
xu=x∗+εq=u∗+εp
给出
J(ε)=∫∞0e−ρt[H(x∗+εq,u∗+εp,λ)+(x∗+εq)(λ˙−ρλ)]dt−limt→∞e−ρtλ(t)[x∗(t)+εq(t)]+λ(0)x(0)
最大Jε=0
Jε=∫∞0e−ρt[Hxq+Hup+q(λ˙−ρλ)]dt−limt→∞e−ρtλ(t)q(t)=0
由于和是不受约束的,因此我们必须
qp
HuHxlimt→∞e−ρtλ(t)=0=ρλ−λ˙=0