QQ线的置信带


14

这个问题不是专门针对 R,但我选择用R它来说明。

考虑一下围绕(正常)qq线产生置信带的代码:

library(car)
library(MASS)
b0<-lm(deaths~.,data=road)
qqPlot(b0$resid,pch=16,line="robust")

我正在寻找一种解释(或替代性的解释为纸/在线文档的链接)这些置信带的构造方式(我已经在R的帮助文件中看到了对Fox 2002的引用,但可惜我没有这个方便的书)。

我的问题将通过一个例子更加精确。这是R计算这些特定CI的方式(我已经缩短/简化了中使用的代码car::qqPlot

x<-b0$resid
good<-!is.na(x)
ord<-order(x[good])
ord.x<-x[good][ord]
n<-length(ord.x)
P<-ppoints(n)
z<-qnorm(P)
plot(z,ord.x,type="n")
coef<-coef(rlm(ord.x~z))
a<-coef[1]
b<-coef[2]
abline(a,b,col="red",lwd=2)
conf<-0.95
zz<-qnorm(1-(1-conf)/2)
SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)     #[WHY?]
fit.value<-a+b*z
upper<-fit.value+zz*SE
lower<-fit.value-zz*SE
lines(z,upper,lty=2,lwd=2,col="red")
lines(z,lower,lty=2,lwd=2,col="red")

问题是:用于计算这些SE的公式的合理性是什么(例如line SE<-(b/dnorm(z))*sqrt(P*(1-P)/n))。

FWIW该公式与线性回归中常用的置信带公式非常不同


2
我希望这与订单统计信息 f X k x = n的分布有关,更特别的渐近结果XÑpÑ˚F-1p
fX(k)(x)=n!(k1)!(nk)![FX(x)]k1[1FX(x)]nkfX(x)
X(np)AN(F1(p),p(1p)n[f(F1(p))]2)
Glen_b-恢复莫妮卡2014年

4
@Glen_b是正确的。约翰福克斯写在35-36页:“次序统计的标准误差小号ÈX = σX(i)
SE(X(i))=σ^p(zi)Pi(1Pi)n
p(z)P(z)X^(i)=μ^+σ^ziX^(i)±2×SE(X(i))

2
f(F1(p))(p(zi)/σ^)

Answers:


6

FXķX=ñķ-1个ñ-ķ[FXX]ķ-1个[1个-FXX]ñ-ķFXX
Xñp一种ñF-1个pp1个-pñ[FF-1个p]2

正如COOLSerdash在评论中提到的那样,John Fox [1]在第35-36页上写道:

订单统计量的标准误差X一世

小号ËX一世=σ^pž一世P一世1个-P一世ñ
哪里 pž 是与CDF对应的概率密度函数 Pž。沿着拟合线的值由下式给出X^一世=μ^+σ^ž一世. An approximate 95% confidence "envelope" around the fitted line is, therefore, X^(i)±2×SE(X(i)).

Then we just need to recognize that f(F1(p)) is estimated by (p(zi)/σ^).

[1] Fox, J. (2008),
Applied Regression Analysis and Generalized Linear Models, 2nd Ed.,
Sage Publications, Inc

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.