如何获得总体r平方变化的置信区间


10

为了简单的示例,假设有两个线性回归模型

  • 模型1有三个预测,x1ax2b,和x2c
  • 模型2具有从模型1 3个预测和两个附加的预测x2ax2b

有一个种群回归方程,其中模型1 解释的种群方差为,模型解释为 。模型2解释的种群中的增量方差为ρ(1)2ρ(2)2Δρ2=ρ(2)2ρ(1)2

我有兴趣获取\ Delta \ rho ^ 2的估计量的标准误差和置信区间Δρ2。虽然该示例分别涉及3个和2个预测变量,但我的研究兴趣涉及大量不同数量的预测变量(例如5个和30个)。我首先想到的是使用 Δradj2=radj(2)2radj(1)2作为估计量并进行引导,但是我不确定是否会适当的。

问题

  • Δradj2一个合理的估计Δρ2
  • 如何获得总体r平方变化的置信区间(即Δρ2)?
  • 引导Δρ2是否适合计算置信区间?

任何对模拟或已发表文献的引用也将受到欢迎。

范例程式码

如果有帮助,我在R中创建了一个小的模拟数据集,可用于演示答案:

n <- 100
x <- data.frame(matrix(rnorm(n *5), ncol=5))
names(x) <- c('x1a', 'x1b', 'x1c', 'x2a', 'x2b')
beta <- c(1,2,3,1,2)
model2_rho_square <- .7
error_rho_square <- 1 - model2_rho_square
error_sd <- sqrt(error_rho_square / model2_rho_square* sum(beta^2))
model1_rho_square <- sum(beta[1:3]^2) / (sum(beta^2) + error_sd^2)
delta_rho_square <- model2_rho_square - model1_rho_square

x$y <- rnorm(n, beta[1] * x$x1a + beta[2] * x$x1b + beta[3] * x$x1c +
               beta[4] * x$x2a + beta[5] * x$x2b, error_sd)

c(delta_rho_square, model1_rho_square, model2_rho_square)
summary(lm(y~., data=x))$adj.r.square - 
        summary(lm(y~x1a + x1b + x1c, data=x))$adj.r.square

担心启动的原因

我对大约300个案例的一些数据进行了引导,在简单模型中使用了5个预测变量,在完整模型中使用了30个预测变量。尽管使用调整后的r平方差进行的样本估计为0.116,但Boosterapped置信区间大部分为CI95%(0.095至0.214),并且自举的平均值与样本估计值相去甚远。相反,增强样本的平均值似乎集中在样本中r平方之间的差异的样本估计上。尽管事实上我使用的是样本调整后的r平方来估算差异。

有趣的是,我尝试了另一种计算为Δρ2

  1. 计算样本r平方变化
  2. 使用标准调整后的r平方公式调整样本r平方变化

当应用于样本数据时,这会将的估计值减少到,但置信区间似乎适合于我首先提到的方法,CI95%(.062,.179),平均值为.118。Δρ2.082

广义上讲,我担心自举假设样本是总体,因此估计过拟合的减少可能无法正常执行。


“但是,我担心引导这样的人口调整后的值可能会有问题。” -为什么呢?
2013

@January我已经编辑了问题,并试图表达出我对使用调整后的R平方进行自举的关注。
Jeromy Anglim 2013年

什么是人口R平方?我看过这里给出定义,但对我来说方差毫无意义,因为分布不相同。 ÿ σy2yi
斯蒂芬·洛朗

@StéphaneLaurent,它是通过总体回归方程在总体中解释的方差百分比。或者,您可以渐近地将其定义为样本量接近无穷大时样本中解释的方差比例。另请参阅有关人口r平方的无偏估计的答案。这在心理学中特别重要,因为在心理学中,我们通常对真实关系更感兴趣,而不是实际应用我们估计的预测方程式。
Jeromy Anglim

3
可以将F检验视为假设检验。可以用来导出您正在寻找的标准误差和置信区间吗?Δρ2=0
Maarten Buis 2013年

Answers:


3

人口R2

我首先试图了解人口R平方的定义。

引用您的评论:

或者,您可以渐近地将其定义为样本量接近无穷大时样本中解释的方差比例。

我想您的意思是,这是样本在无限次复制模型多次时的极限(每次复制都具有相同的预测变量)。 R2

那么,样本的渐近值的公式是什么?像https://stats.stackexchange.com/a/58133/8402一样编写线性模型,并使用与此链接相同的符号。 然后,当一个人无限次地复制模型时,可以检查样本到达。R² - [R2 p ö p - [R 2= λY=μ+σG
R2 ÿ=μ+σG ^popR2:=λn+λY=μ+σG

例如:

> ## design of the simple regression model lm(y~x0)
> n0 <- 10
> sigma <- 1
> x0 <- rnorm(n0, 1:n0, sigma)
> a <- 1; b <- 2 # intercept and slope
> params <- c(a,b)
> X <- model.matrix(~x0)
> Mu <- (X%*%params)[,1]
> 
> ## replicate this experiment k times 
> k <- 200
> y <- rep(Mu,k) + rnorm(k*n0)
> # the R-squared is:
> summary(lm(y~rep(x0,k)))$r.squared 
[1] 0.971057
> 
> # theoretical asymptotic R-squared:
> lambda0 <- crossprod(Mu-mean(Mu))/sigma^2
> lambda0/(lambda0+n0)
          [,1]
[1,] 0.9722689
> 
> # other approximation of the asymptotic R-squared for simple linear regression:
> 1-sigma^2/var(y)
[1] 0.9721834

人口子模型的R2

现在假设模型是 具有并考虑子模型的子模型。 ħ1μ&Element;w ^1H ^0μ&Element;w ^0Y=μ+σGH1:μW1H0:μW0

然后我在上面说过,模型的总体是 ,其中和,然后一个人只拥有。ħ 1 p ö p - [R 2 1= λ 1R2H1popR12:=λ1n+λ1 ž1=[1]w ^1Pž1μ2=Σμ-ˉμ2λ1=PZ1μ2σ2Z1=[1]W1PZ1μ2=(μiμ¯)2

现在你定义人口中的子模型为的渐近值相对于模型计算但模型的分配假设下?渐近值(如果有)似乎更难找到。H 0 R 2 H 0 H 1R2 H0R2H0H1


谢谢斯特凡。我得考虑一下你在说什么。关于您的问题。我假定真实数据生成处理是不知道,但它为fo两个模型是相同的,但有方差的真比重在模型1和模型2中说明由线性回归
杰罗米Anglim

的@JeromyAnglim式(A3)本文是我的公式为单向ANOVA模型的特殊情况。因此,我的公式应该是总体的一般定义,但这不是您在OP中使用的定义。R2
斯特凡·洛朗

1
@JeromyAnglim本文的研究似乎与您正在寻找的(使用随机预测变量)接近。
斯特凡·洛朗

谢谢。Algina,Keselman和Penfield的论文看起来非常有用。我在回答中添加了一些评论
Jeromy Anglim

@JeromyAnglim那么关于预测变量的假设是什么?它们是根据多元高斯分布生成的?
斯特凡·洛朗

1

除了要回答您提出的问题外,我要问您为什么要问这个问题。我想你想知道是否

mod.small <- lm(y ~ x1a + x1b + x1c, data=x)

至少和

mod.large <- lm(y ~ ., data=x)

在解释y。由于这些模型是嵌套的,因此回答此问题的明显方法似乎是对它们进行方差分析,就像您对两个GLM进行偏差分析一样。

anova(mod.small, mod.large)

然后,您可以使用模型之间的样本R平方改进作为对总体总体拟合改进的最佳猜测,始终假设您可以理解总体R平方。就我个人而言,我不确定是否可以,但是无论哪种方式都没有关系。

更一般而言,如果您对总体数量感兴趣,那么您大概会对泛化感兴趣,因此样本拟合度量不是您想要的,而是“校正的”。例如,对一些数量的交叉验证(如MSE)可以估计您可能希望从样本中得出的实际错误的种类和数量,这似乎可以满足您的要求。

但是我很可能在这里错过了一些东西...


感谢您的回答,这对其他人可能是个很好的建议。但是我的研究背景意味着我对delta-rho square有兴趣。尽管大多数统计学家通常更关注模型的预测效用(例如,交叉验证的delta平方),但我是一名心理学家,尤其对人口属性感兴趣。此外,我对改进的统计意义不感兴趣。我对改进的规模感兴趣。而且我发现delta-r-square是索引改善大小的有用指标。
Jeromy Anglim

关于MSE,心理学方面的不同研究使用的指标差异很大。因此,对标准化度量(例如r平方)的吸引力是对还是错。
Jeromy Anglim

足够公平,尤其是在MSE上。我对自举和总体推断的兴趣仍然有些困惑,但是对测试缺乏兴趣,因为也许天真地,这些似乎是不同解决的等效问题。我也很难将样本预测与对人群的推断区分开来,但这很可能妨碍了咖啡前的膝盖混蛋贝叶斯主义(预测只是另一个人口推断问题)。
2013年

也许我说得很快。在我的研究背景下,经常有大量证据表明Δrho平方大于零。感兴趣的问题是增加的程度是多少。即,这是微不足道的增加或理论上有意义的增加。因此,置信度或可信区间使我估计了该增长附近的不确定性。我对贝叶斯统计数据的理解尚未与我在这里所做的事情相吻合,但我希望这样做。
Jeromy Anglim

1

以下是在上计算置信区间的几种可能性。ρ2

双调整R平方自举

我目前对答案的最佳猜测是进行双重调整的r平方自举。我已经实施了这项技术。它涉及以下内容:

  • 根据当前数据生成一组引导程序样本。
  • 对于每个引导示例:
    • 计算两个模型的第一个调整后的r平方
    • 根据上一步的调整后r平方值计算第二个调整后r平方
    • 从model1第二调整后的r平方值中减去model2以获得的估计值。Δρ2

基本原理是,第一个调整后的r平方消除了自举引入的偏差(即,自举假设样本r平方是总体r平方)。第二个调整的r平方执行应用于普通样本的标准校正,以估计总体r平方。

在这一点上,我所能看到的就是应用该算法生成的估计值似乎是正确的(即,引导程序中的均值theta_hat非常接近样本theta_hat)。标准错误符合我的直觉。我尚未测试它是否可以在已知的数据生成过程中提供适当的常客性报道,并且我目前还不确定要如何从第一原理中得出论证的依据

如果有人发现这种方法存在问题的任何原因,我将不胜感激。

Algina等人的模拟

Stéphane提到了Algina,Keselman和Penfield的文章。他们进行了仿真研究,以检验自举和渐近方法的95%置信区间覆盖率,以估计。他们的引导方法仅涉及调整后的r平方的单个应用,而不是我上面提到的对r平方的双重调整。他们发现,仅当整个模型中的其他预测变量的数量为一或两个时,引导估计才可以提供很好的覆盖范围。我的假设是,这是因为随着预测变量数量的增加,单次调整和二次调整的r平方自举之间的差异也会增加。Δρ2

Smithson(2001)关于使用非中心性参数

Smithson(2001)讨论了基于非中心性参数计算部分的置信区间。尤其请参见第615和616页。他建议“为和部分构造CI,而不是为平方半部分相关性构造CI ”。(第615页)f 2 R 2R2f2R2

参考文献

  • Algina,J.,Keselman,HJ和Penfield,RD的置信区间为平方的多个半部分相关系数的平方。PDF格式
  • Smithson,M。(2001)。为各种回归效应大小和参数校正正确的置信区间:计算区间中非中心分布的重要性。教育与心理测量,61(4),605-632。

1
似乎这里的所有人(包括您)都不知道您的总体R平方的定义。因此,恕我直言,这是一个严重问题的方法。
斯特凡劳伦

@StéphaneLaurent谢谢。我承认,到目前为止,我还没有将人口R平方视为竞争的属性。例如,我可以提出一个数据生成过程,并且当我的模拟样本大小接近无穷大时,将出现一个r平方。同样,我假设我的数据有一个数据生成过程,因此,如果有可能获得一个无限的样本,我就可以计算出真实的总体r平方。
Jeromy Anglim

是的,但我给您的印象是您还假设了预测变量的生成过程。我无法弄清楚这对于一般的线性模型如何有意义。
斯特凡·洛朗
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.