动态编程:验证原理
考虑的大风蛋糕问题,因此问题变为:u(c)=log(c)u(c)=log(c)u(c) = log(c)maxx∑t=0∞βtlog(xt−xt+1)sub0<xt+1≤xt,x0>0 givenmaxx∑t=0∞βtlog(xt−xt+1)sub0<xt+1≤xt,x0>0 given\max_{x}\sum_{t=0}^{\infty} \beta^{t}log(x_t-x_{t+1})\: sub\: 00\ given 很容易证明函数v:(0,x0]→Rv:(0,x0]→Rv:(0,x_0]\rightarrow\mathbb{R}由v(x)=A+Blog(x)v(x)=A+Blog(x)v(x)=A+B\:log(x),其中A=β(1−β)2logβ+11−βlog(1−β)A=β(1−β)2logβ+11−βlog(1−β)A=\frac{\beta}{(1-\beta)^2}log\beta+\frac{1}{1-\beta}log(1-\beta)和B=11−βB=11−βB=\frac{1}{1-\beta}是Bellman的解决方案我也知道这是蛋糕问题的值函数,但不符合经典的验证原理,即limt→+∞βtv(xt)=0limt→+∞βtv(xt)=0\lim_{t \to +\infty} \beta^tv(x_t) = 0。 我应该如何继续实际证明v(x)v(x)v(x)是问题的价值函数?