这个问题不是专门针对 R
,但我选择用R
它来说明。
考虑一下围绕(正常)qq线产生置信带的代码:
library(car)
library(MASS)
b0<-lm(deaths~.,data=road)
qqPlot(b0$resid,pch=16,line="robust")
我正在寻找一种解释(或替代性的解释为纸/在线文档的链接)这些置信带的构造方式(我已经在R的帮助文件中看到了对Fox 2002的引用,但可惜我没有这个方便的书)。
我的问题将通过一个例子更加精确。这是R
计算这些特定CI的方式(我已经缩短/简化了中使用的代码car::qqPlot
)
x<-b0$resid
good<-!is.na(x)
ord<-order(x[good])
ord.x<-x[good][ord]
n<-length(ord.x)
P<-ppoints(n)
z<-qnorm(P)
plot(z,ord.x,type="n")
coef<-coef(rlm(ord.x~z))
a<-coef[1]
b<-coef[2]
abline(a,b,col="red",lwd=2)
conf<-0.95
zz<-qnorm(1-(1-conf)/2)
SE<-(b/dnorm(z))*sqrt(P*(1-P)/n) #[WHY?]
fit.value<-a+b*z
upper<-fit.value+zz*SE
lower<-fit.value-zz*SE
lines(z,upper,lty=2,lwd=2,col="red")
lines(z,lower,lty=2,lwd=2,col="red")
问题是:用于计算这些SE的公式的合理性是什么(例如line SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)
)。
2
我希望这与订单统计信息 f X (k )(x )= n的分布有关!,更特别的渐近结果:X(⌈Ñp⌉)〜甲Ñ(˚F-1(p
—
Glen_b-恢复莫妮卡2014年