(这是Granger&Newbold(1986)“预测经济时间序列”的改编)。
通过构造,您的错误成本函数为。这包含了一个严格的假设(误差成本函数在零附近对称)-不同的误差成本函数不一定具有条件期望值,因为其期望值的。您无法最小化错误成本函数,因为它包含未知数量。因此,您决定将其期望值最小化。然后你的目标函数变成 arg分钟[Y−g(X)]2argmin
E[Y−g(X)]2=∫∞−∞[y−g(X)]2fY|X(y|x)dy
我相信这也会回答您的第二个问题。这是直观的,预期值将是有条件的,因为我们试图估计/预测基于。分解平方得到X Y XYXYX
E[Y−g(X)]2=∫∞−∞y2fY|X(y|x)dy−2g(X)∫∞−∞yfY|X(y|x)dy+[g(X)]2∫∞−∞fY|X(y|x)dy
第一项不包含因此它不影响最小化,因此可以忽略。第二项中的积分等于给定的的条件期望值,最后一项中的积分等于1。所以Y Xg(X)YX
argming(x)E[Y−g(X)]2=argming(x){−2g(X)E(Y∣X)+[g(X)]2}
一阶导数wrt为导致一阶条件最小化而二阶导数等于,这足以达到最小值。− 2 E (Y ∣ X )+ 2 g (X )g (X )= E (Y ∣ X )2 > 0g(X)−2E(Y∣X)+2g(X)g(X)=E(Y∣X)2>0
附录:“加减法”证明方法的逻辑。
OP对问题中所述的方法感到困惑,因为它似乎是重言式的。并非如此,因为当使用加减法使目标函数的特定部分为零时,任意选择要加减的项时,它不会使值函数相等,即目标值在候选极小值处评估的函数。
对于选择我们具有值函数
对于任意选择我们具有值函数。V (È (Ý | X )) = È [(Ý - ë (Ý | X ))2 | X ]克(X )= H ^ (X )V (ħ (X )) = E [(Y − h (g(X)=E(Y∣X)V(E(Y∣X))=E[(Y−E(Y∣X))2∣X]g(X)=h(X)V(h(X))=E[(Y−h(X))2∣X]
我声称
⇒ È (Ý 2 | X )- 2 ë [(Ý ë (Ý | X ))| X ] + ë [(ë (ÿ | X ))2 ∣ X ]
V(E(Y∣X))≤V(h(X))
⇒E(Y2∣X)−2E[(YE(Y∣X))∣X]+E[(E(Y∣X))2∣X]≤E(Y2∣X)−2E[(Yh(X))∣X]+E[(h(X))2∣X]
LHS和RHS的第一期取消。还要注意,外部期望是基于条件。通过条件期望的性质,我们最终得到X
...⇒−2E(Y∣X)⋅E(Y∣X)+[E(Y∣X)]2≤−2E(Y∣X)h(X)+[h(X)]2
⇒0≤[E(Y∣X)]2−2E(Y∣X)h(X)+[h(X)]2
ħ (X )≠ È (Ý | X )ë (Ý | X )
⇒0≤[E(Y∣X)−h(x)]2
如果则具有严格的不等式。因此是全局且唯一的最小化器。
h(x)≠E(Y∣X)E(Y∣X)
但这也表明,“加减法”并不是这里最有启发性的证明方式。