Answers:
您的估计等于Mann-Whitney统计量除以(感谢Glen!),因此等于Wilcoxon秩和统计量(也称为Wilcoxon-Mann-Whitney统计量) : ,其中是的样本大小(假定无联系。)因此,您可以使用Wilcoxon检验的表/软件并将其转换回获得置信区间或值。
令为的样本大小, =。然后,渐近地
资料来源: Hollander and Wolfe,《非参数统计方法》,第p页。117,但可能大多数非参数统计书都可以帮助您。
@jbowman为估计的问题提供了一个(不错的)标准解决方案,这就是应力强度模型。
Baklizi和Eidous(2006)提出了另一个非参数替代方案,用于和独立的情况。如下所述。ÿ
根据定义,我们有
其中是的CDF和是密度。然后,使用的样品和我们可以得到核估计的和,因此和估计 X ˚F ý ý X ý ˚F X ˚F ÿ θ
这在下面的R代码中使用高斯内核实现。
# Optimal bandwidth
h = function(x){
n = length(x)
return((4*sqrt(var(x))^5/(3*n))^(1/5))
}
# Kernel estimators of the density and the distribution
kg = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(dnorm((x[i]-data)/hb))/hb
return(r )
}
KG = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(pnorm((x[i]-data)/hb))
return(r )
}
# Baklizi and Eidous (2006) estimator
nonpest = function(dat1B,dat2B){
return( as.numeric(integrate(function(x) KG(x,dat1B)*kg(x,dat2B),-Inf,Inf)$value))
}
# Example when X and Y are Cauchy
datx = rcauchy(100,0,1)
daty = rcauchy(100,0,1)
nonpest(datx,daty)
为了获得的置信区间,您可以按以下方式获取此估计量的引导样本。
# bootstrap
B=1000
p = rep(0,B)
for(j in 1:B){
dat1 = sample(datx,length(datx),replace=T)
dat2 = sample(daty,length(daty),replace=T)
p[j] = nonpest(dat1,dat2)
}
# histogram of the bootstrap sample
hist(p)
# A confidence interval (quantile type)
c(quantile(p,0.025),quantile(p,0.975))
也可以考虑其他类型的引导时间间隔。
考虑成对的差值, 那么对于是iid Bernoulli随机变量。所以数的是二项式。然后是概率和置信区间的无偏估计,并且可以基于二项式进行假设检验。 P (X 我 - ý 我 < 0 )= p 我{ X 我 - ý 我 < 0 } 我= 1 ,2 ,。。,n X X i < Y i n p = P (X i - Y i < 0 )X / n