有条件期望证明作为最佳预测因子的问题


19

我的证明有问题

E(Y|X)argming(X)E[(Yg(X))2]

这很可能表明人们对期望和有条件的期望有更深的误解。

我知道的证明如下(此证明的另一个版本可以在这里找到)

argming(X)E[(Yg(x))2]=argming(X)E[(YE(Y|X)+E(Y|X)g(X))2]=argming(x)E[(YE(Y|X))2+2(YE(Y|X))(E(Y|X)g(X))+(E(Y|X)g(X))2]=argming(x)E[2(YE(Y|X))(E(Y|X)g(X))+(E(Y|X)g(X))2]

然后,证明通常以一个论点继续进行,该论证表明2E[(YE(Y|X))(E(Y|X)g(X))]=0,因此

argming(x)E[(Yg(x))2]=argming(x)E[(E(Y|X)g(X))2]

g(X)= E(Y | X)时,可以看到最小化g(X)=E(Y|X)

我对证明的困惑如下:

  1. 考虑

E[2(YE(Y|X))(E(Y|X)g(X))+(E(Y|X)g(X))2]

在我看来,独立于任何表明第一项始终等于零的参数,可以看到设置g(X)=E(Y|X)会使表达式最小化,因为它暗示了Ëÿ|X-GX=0,因此

E[2(YE(Y|X))(E(Y|X)g(X))+(E(Y|X)g(X))2]=E(0+0) = 0。

但如果这是真的,那么人们可能会重复的证明代替通过任何其他函数,称,并得到这样的结论:它是最小化的表达。因此,肯定有一些我误会的东西(对吗?)。X ^ h X ^ h X E(Y|X)Xh(X)h(X)

  1. 在问题陈述中,我对的含义有疑问。该符号应如何解释?是不是意思Ë[ÿ-GX2]

E Y [ Y - g X 2 ] E X Y [ Y - g X 2 ]ËX[ÿ-GX2],或吗?Ëÿ[ÿ-GX2]ËXÿ[ÿ-GX2]

Answers:


11

(这是Granger&Newbold(1986)“预测经济时间序列”的改编)。

通过构造,您的错误成本函数为。这包含了一个严格的假设(误差成本函数在零附近对称)-不同的误差成本函数不一定具有条件期望值,因为其期望值的。您无法最小化错误成本函数,因为它包含未知数量。因此,您决定将其期望值最小化。然后你的目标函数变成 arg分钟[Yg(X)]2argmin

E[Yg(X)]2=[yg(X)]2fY|X(y|x)dy

我相信这也会回答您的第二个问题。这是直观的,预期值将是有条件的,因为我们试图估计/预测基于。分解平方得到X Y XYXYX

E[Yg(X)]2=y2fY|X(y|x)dy2g(X)yfY|X(y|x)dy+[g(X)]2fY|X(y|x)dy

第一项不包含因此它不影响最小化,因此可以忽略。第二项中的积分等于给定的的条件期望值,最后一项中的积分等于1。所以Y Xg(X)YX

argming(x)E[Yg(X)]2=argming(x){2g(X)E(YX)+[g(X)]2}

一阶导数wrt为导致一阶条件最小化而二阶导数等于,这足以达到最小值。2 E Y X + 2 g X g X = E Y X 2 > 0g(X)2E(YX)+2g(X)g(X)=E(YX)2>0

附录:“加减法”证明方法的逻辑。

OP对问题中所述的方法感到困惑,因为它似乎是重言式的。并非如此,因为当使用加减法使目标函数的特定部分为零时,任意选择要加减的项时,它不会使值函数相等,即目标值在候选极小值处评估的函数。

对于选择我们具有值函数 对于任意选择我们具有值函数。V È Ý | X = È [Ý - ë Ý | X 2 | X ]X = H ^ X V ħ X = E [Y h g(X)=E(YX)V(E(YX))=E[(YE(YX))2X]g(X)=h(X)V(h(X))=E[(Yh(X))2X]

我声称

È Ý 2 | X - 2 ë [Ý ë Ý | X | X ] + ë [ë ÿ | X 2X ]

V(E(YX))V(h(X))
E(Y2X)2E[(YE(YX))X]+E[(E(YX))2X]E(Y2X)2E[(Yh(X))X]+E[(h(X))2X]

LHS和RHS的第一期取消。还要注意,外部期望是基于条件。通过条件期望的性质,我们最终得到X

...2E(YX)E(YX)+[E(YX)]22E(YX)h(X)+[h(X)]2

0[E(YX)]22E(YX)h(X)+[h(X)]2

ħ X È Ý | X ë Ý | X

0[E(YX)h(x)]2
如果则具有严格的不等式。因此是全局且唯一的最小化器。h(x)E(YX)E(YX

但这也表明,“加减法”并不是这里最有启发性的证明方式。


感谢您的回答。这有助于澄清我的第二个问题。当我试图传达问题的标题时,我的主要问题(帖子中的第一个问题)更多地是关于证明机制。我主要关心的是我对问题中提出的证据的理解。正如我所解释的那样,对证明的理解使我提出了公然有问题的陈述。因此,我想了解我的错误是因为它可能揭示出对期望行为和条件期望的一些更深层次的误解。有什么想法吗?
Martin Van der Linden

1
我为“加法和减法”方法添加了一些解释。
Alecos Papadopoulos

花了我一些时间来理解它,但终于有了我的基本错误:足够真实当,但这绝不意味着使表达式最小化。没有理由将括号中的表达式不能小于零。由于前面的减号,人们可以找到一些使得。Ë[-2ÿ-HXHX-GX+HX-GX2]=0GX=HXHXÿ-HXHX-GXGXË[-2ÿ-HXHX-GX+HX-GX2]<0
Martin Van der Linden

1
嗯...您所引用的表达式中的减号是一个错误-它应该是一个加号。您当然可以重新排列条件以再次获得减号...这是否损害了您获得的直觉?
Alecos Papadopoulos

感谢您关注这个问题。我编辑了最初的帖子以纠正此错误。幸运的是,我认为这不会损害所获得的直觉。实际上,它可以帮助我理解另一个错误:我假设负号对于确保不一定是的最小值。但是我意识到这不仅是2之前的符号。(希望如此)我真正需要理解的是,通常(即对于任意)当(对吗?)时,不需要最小化。0Ë[-2ÿ-HXHX-GX+HX-GX2]HXË[2ÿ-HXHX-GX]GX=HX
Martin Van der Linden

5

请注意,要证明答案,您实际上只需要证明

Ë[-2ÿ-Ëÿ|XËÿ|X-GX]=0

至于要采取哪种期望,请有条件地采取,否则该术语

精氨酸GXË[ÿ-GX2]

这没有意义,因为如果为而不是,则是一个随机变量。显示您应该真正写或来说明这一点。现在,有了这个澄清,术语是一个常数,可以拉到期望值之外,并且您具有:GXËËXÿËÿ|XË[ÿ-GX2|X]Ëÿ|X[ÿ-GX2]Ëÿ|X-GX

-2Ëÿ|X-GXË[ÿ-Ëÿ|X|X]=-2Ëÿ|X-GX[Ëÿ|X-Ë[Ëÿ|X|X]]=-2Ëÿ|X-GX[Ëÿ|X-Ëÿ|X]=0

因此,您可以将目标函数编写为:

Ëÿ|X[ÿ-GX2]=Ëÿ|X[ÿ-Ëÿ|Xÿ|X2]+Ëÿ|Xÿ|X-GX2

从这里可以看出最小化。请注意,如果还要对求平均值,则可以使用非常相似的参数来显示:X

ËX[Ëÿ|X-GX2]=ËX[Ëÿ|Xÿ|X-ËX[Ëÿ|Xÿ|X]2]+ËX[Ëÿ|Xÿ|X]-ËX[GX]2

这表明如果为每个设置,那么您对该函数也将具有最小化要求。因此,从某种意义上说,是还是并不重要。GX=Ëÿ|Xÿ|XXËËÿXËÿ|X


3

有一种非常简单的数学观点。您所拥有的是希尔伯特空间中的投影问题,就像将的向量投影到子空间上一样。[Rñ

令表示潜在的概率空间。为了使问题有意义,请考虑具有有限第二矩的随机变量,即希尔伯特空间。现在的问题是:给定,找到在子空间上的投影 ,其中是生成的的 -sub代数。(就像在有限维情况下一样,将到子空间的距离最小化意味着找到投影)。所需的投影是ΩFμ大号2ΩFμXÿ大号2ΩFμÿ大号2ΩFXμFXσFX大号2ËX|ÿ,通过构造。(如果检查存在的证据,这实际上表征)。ËX|ÿ


这是一个很好的回应。
2015年

0

关于最后一个问题,期望可以是wrt(无条件误差)或wrt(每个值的条件误差)。令人高兴的是,在每个值处将条件误差最小化也将无条件误差最小化,因此这不是关键的区别。pXÿpÿXX=XX=X

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.