R平方的条件期望


18

考虑简单的线性模型:

yy=Xββ+ϵ

其中ϵii.i.d.N(0,σ2)XRn×p,和包含常数的列。p2X

我的问题是,给定,和,是否存在 * 上非平凡上界的公式?(假设模型是由OLS估算的)。E(XX)βσE(R2)

*我以书面形式假设,不可能获得本身。E(R2)

编辑1

使用StéphaneLaurent派生的解决方案(见下文),我们可以得出的非平凡上界。一些数值模拟(如下)表明,这个界限实际上是很严格的。E(R2)

斯特凡·洛朗(StéphaneLaurent)得到了以下: 其中是具有以下项的非中心Beta分布非中心参数与R2B(p1,np,λ)B(p1,np,λ)λ

λ=||XβE(X)β1n||2σ2

所以

E(R2)=E(χp12(λ)χp12(λ)+χnp2)E(χp12(λ))E(χp12(λ))+E(χnp2)

其中是具有参数和自由度的非中心。因此的非平凡上限是χk2(λ)χ2λkE(R2)

λ+p1λ+n1

非常紧(比我预期的要紧得多):

例如,使用:

rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)

在1000次仿真中的平均值为。上面的理论上限给出。在许多值上,边界似乎同样精确。真令人震惊!R20.9608190.9609081R2

编辑2:

经过进一步研究,似乎随着增加(与其他所有相等的情况,随增加),对的上限近似的质量会更好。λ + p λ ÑE(R2)λ+pλn


R2具有Beta分布,其参数仅取决于和。不是吗 np
斯特凡·洛朗

1
抱歉,我先前的主张仅在“空模型”(仅拦截)的假设下才是正确的。否则,的分布应类似于非中心Beta分布,其非中心参数涉及未知参数。R2
斯特凡·洛朗

@StéphaneLaurent:谢谢。您是否会进一步了解未知参数和Beta参数之间的关系?我被卡住了,所以任何指针都将受到欢迎……
user603 2013年

您是否绝对需要处理?也许对于E [ R 2 /1 - R 2]有一个简单的精确公式。E[R2]E[R2/(1R2)]
斯特凡·洛朗

1
用我的答案符号,对于某些标量k,并且非中心F分布的第一矩很简单。R2/(1R2)=kFkF
斯特凡·洛朗

Answers:


13

任何线性模型可以写成其中ģ对标准正态分布ř Ñμ被假定为属于一个线性子空间W¯¯ř Ñ。在您的情况下,W = Im X Y=μ+σGGRnμWRnW=Im(X)

是由载体产生的一维线性子空间1 1 ... 1 。服用Ù = [ 1 ]下面,对- [R 2是高度相关的经典费歇尔统计 ˚F = P ž ý 2 /- [1]W(1,1,,1)U=[1]R2 为的假设检验ħ0{μ&Element;ù}其中ÚW¯¯是线性子空间,并且由表示 ž=ûW¯¯的正交补ùW中,分别表示m=昏暗W=昏暗U

F=PZY2/(m)PWY2/(nm),
H0:{μU}UWZ=UWUWm=dim(W)=dim(U)(则= 1)。m=p=1

确实, ,因为的定义- [R2- [R2=P ž ÿ 2

PZY2PWY2=R21R2
R2
R2=PZY2PUY2=1PWY2PUY2.

显然P W¯¯ Ŷ = σ P w ^ g ^PZY=PZμ+σPZGPWY=σPWG

为真H0:{μU},因此 ˚F = P ž ģ 2 /- PZμ=0 具有费希尔˚F-ñ-分布。因此,来自费希尔分布和Beta分布之间的经典关系- [R2-ñ-

F=PZG2/(m)PWG2/(nm)Fm,nm
Fm,nmR2B(m,nm)

在一般的情况,我们必须处理P ž μ 0。在这种一般的情况下一个具有P ž ý 2σ 2 χ 2 - λ 时,非中心χ 2与分布- 自由度和noncentrality参数λ = PZY=PZμ+σPZGPZμ0PZY2σ2χm2(λ)χ2m,然后 ˚F˚F-ñ-λ(非中心费舍尔分布)。这是用于计算F检验功效的经典结果。λ=PZμ2σ2FFm,nm(λ)F

Fisher分布和Beta分布之间的经典关系在非中心情况下也成立。最后,具有非中心贝塔分布,其“形状参数”为m - n - m,非中心参数为λ。我认为这些时刻可以从文献中找到,但它们可能非常复杂。R2mnmλ

最后,让我们写下。需要注意的是P ž = P w ^ - P ü。一个具有P Ù μ = ˉ μ 1ù = [ 1 ],和P w ^ μ = μ。因此P ž μ = μ - ˉ μ 1,其中这里μ = X β为未知参数向量βPZμPZ=PWPUPUμ=μ¯1U=[1]PWμ=μPZμ=μμ¯1μ=Xββ


1
x在线性子空间 Z上的正交投影。和 P 表示上的正交投影。PZxxZP
斯特凡·洛朗

1
当心。我将编辑帖子以编写公式。PxPx2
斯特凡·洛朗

1
完成-您看到任何简化了吗?
斯特凡·洛朗

1
μ¯=1nμi
斯特凡劳伦

1
类型I很明显:类型II分布在。实际上,R 2 /1 - R 2具有II型分布。我已经做了今天的最后更正。(0,)R2/(1R2)
斯特凡·洛朗
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.