动态编程:验证原理


1

考虑的大风蛋糕问题,因此问题变为:u(c)=log(c)

maxxt=0βtlog(xtxt+1)sub0<xt+1xt,x0>0 given

很容易证明函数v:(0,x0]Rv(x)=A+Blog(x),其中A=β(1β)2logβ+11βlog(1β)B=11β是Bellman的解决方案我也知道这是蛋糕问题的值函数,但不符合经典的验证原理,即limt+βtv(xt)=0

我应该如何继续实际证明v(x)是问题的价值函数?


也许您没有完成验证原则的表达?极限应评估什么?我猜0<β<1吗?
Alecos Papadopoulos

抱歉耽搁了。上面的表达式是验证原理之一,在这种情况下不起作用。我知道还有其他人。β(0,1),就可以了。
PhDing

我无法理解该表达式,因为它只记录了一个限制。它不会写出限制的值。就其本身而言,它不是验证原理,而只是一个不完整的数学表达式。
Alecos Papadopoulos

限制的值不重要。知道它不等于零就足够了,即不满足我编写的验证原理。还有其他方法可以证明是上述RF问题的值函数吗?v(x)
PhDing

因此,您似乎应该在问题中写下“未达到 ”。您为什么假定读者会知道验证原理意味着该限制应为零?limt+βtv(xt)=0
Alecos Papadopoulos
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.