我正在使用分位数回归来找到我数据的90%的预测变量。我正在R中使用该quantreg
软件包进行此操作。我如何确定分位数回归的,这将指示预测变量解释了多少可变性?
我真正想知道的是:“我能用什么方法来解释多少可变性?”。P值的显着性水平在命令输出中可用:summary(rq(formula,tau,data))
。我怎样才能得到健康?
我正在使用分位数回归来找到我数据的90%的预测变量。我正在R中使用该quantreg
软件包进行此操作。我如何确定分位数回归的,这将指示预测变量解释了多少可变性?
我真正想知道的是:“我能用什么方法来解释多少可变性?”。P值的显着性水平在命令输出中可用:summary(rq(formula,tau,data))
。我怎样才能得到健康?
Answers:
Koenker和Machado描述了,它是特定(τ)分位数的局部拟合优度的局部量度。
假设和是完整模型和受限模型的系数估计,而和是相应的项。
他们定义拟合标准。
Koenker 在此给出代码,
rho <- function(u,tau=.5)u*(tau - (u < 0))
V <- sum(rho(f$resid, f$tau))
因此,如果我们计算与拦截,只是一个模型( -或在下面的代码片段),然后无限制模式(),我们可以计算出这是-至少在理论上-有点像通常的。V0
R1 <- 1-Vhat/V0
编辑:当然,在您的情况下,第二个参数(f$tau
无论tau
您使用的是哪个值)都将放在第二行代码的调用中。第一行中的值仅设置默认值。
“解释均值方差”确实不是您使用分位数回归所做的事情,因此您不应期望拥有一个真正等效的度量。
我认为的概念不能很好地转化为分位数回归。您可以在此处定义各种或多或少的类似数量,但是无论您选择什么,都不会拥有在OLS回归中具有的大多数属性。您需要清楚需要的属性和不需要的属性-在某些情况下,可能有一种方法可以满足您的需求。
-
Koenker,R和Machado,J(1999),
拟合优度和相关推论过程的分位数回归,
《美国统计协会杂志》,94:448,1296-1310
tau
在调用函数时指定,第一行中的值0.5只是默认参数。我会在帖子中澄清。
Koenker和Machado(1999)在JASA中提出的伪度量通过将感兴趣模型的加权偏差之和与仅出现截距的模型的相同偏差进行比较,来衡量拟合优度。计算为
其中ÿ我 = α τ + β τ X是拟合τ个位数观察我,和ˉ ÿ = β τ是从仅截距模型的拟合值。
应该位于 [ 0 ,1 ],其中1将对应于完美的结合,因为它由偏差的加权和的分子将是零。由于它取决于 τ,因此它是QRM拟合的局部度量,这不同于OLS的全局 R 2。可以说这是有关使用它的警告的来源:如果您将模型拟合在尾部,则不能保证它在其他任何地方都拟合得很好。该方法也可以用于比较嵌套模型。
这是R中的示例:
library(quantreg)
data(engel)
fit0 <- rq(foodexp~1,tau=0.9,data=engel)
fit1 <- rq(foodexp~income,tau=0.9,data=engel)
rho <- function(u,tau=.5)u*(tau - (u < 0))
R1 <- 1 - fit1$rho/fit0$rho
这可能可以更优雅地完成。
R_1(\tau) = 1 -
最后一个字符是一团糟。你能检查一下吗?也许你粘贴一些非标准的字符,而不是使用德州