来自单面Kolmogorov-Smirnov检验的和的两个样本CDF是多少?


9

我想了解如何获得 -值对片面柯尔莫哥洛夫-斯米尔诺夫检验,以及我在努力寻找的CDF和(在两个样本的情况下)。在一个示例中,以下几处被引用为的CDF :pDn1,n2+Dn1,n2Dn+

pn+(x)=P(Dn+x|H0)=xj=0n(1x)(nj)(jn+x)j1(1xjn)nj

另外,whuber sez对此单样本CDF的表示形式略有不同(我将x替换xt,以与此处的符号保持一致):

使用概率积分变换,唐纳德·努斯推导了它们在p上的(公共)分布。TAoCP第2卷的第57页和练习17。

(Dn+xn)=xnnckx(nk)(kx)k(x+nk)nk1

这将适用于单样本情况下的单边假设,例如:H 0F(x)F00,其中F(x)是经验CDF的x,和F0是一些CDF。

认为这种情况下的x是一个人的样本中Dn+的值,n(1x)n-nx中最大的整数nnx。(那正确吗?)

但是当一个具有两个样本时,(或的CDF是多少?例如,对于和的经验CDF ,当H?如何获得?Dn1,n2+Dn1,n20FA(x)FB(x)0ABpn1,n2+


1
就像任何想回答这个问题的人的指针一样,我对亚历克西斯上一个问题的回答(在上面的问题中链接)具有指向一些参考文献的链接,这些参考文献对历史进行了一些讨论,每个参考文献都有许多相关的参考文献。您可能需要检查这些文档及其参考列表。
Glen_b-恢复莫妮卡2014年

@Glen_b谢谢!非常感谢您对另一个问题的出色回答,并且确实遵循了引用的资源,但是我对CDF的毫无兴趣,而不是停滞我认为我会打开一个新查询的评论。如果您知道适用于此的其他参考文献,欢迎使用。D+
亚历克西斯

亚历克西斯:我的评论无意批评。您选择打开一个新问题是完全正确的(我认为)。我只是想让人们在追踪一些相关参考文献时省些麻烦-我认为每个人都不一定会跟随您对另一个问题的链接,而在我中进行此链接的人可能并不会想到答案有一些他们可能想知道的参考。
Glen_b-恢复莫妮卡2014年

Answers:


6

好吧,我要对此进行一试。欢迎提供重要见解。

在第192页的Gibbons和Chakraborti(1992),引用霍奇斯(Hodges),1958年,从用于双面测试的小样本CDF开始(我将和表示法交换为和分别):m,ndn1,n2x

P(Dn1,n2x)=1P(Dn1,n2x)=1A(n1,n2)(n1+n2n1)

其中是通过从原点到点)的路径枚举(在和单调增加)产生的的图形,其中用代替 -x轴和y轴的值为和。路径还必须遵守留在边界内的约束(其中是Kolmogorov-Smirnov检验统计量的值):A(n1,n2)n1n2(n1,n2)Sm(x)Fn1(x)n1F1(x)n2F2(x)x

n2n1±(n1+n2)x(n1+n2n1)

是它们的图像,图3.2提供了的示例,其中包含12条这样的路径:A(3,4)

图3.2来自Gibbons和Chakraborti(1992)非参数统计推断的第193页。

Gibbons和Chakaborti继续说,单侧 值是使用相同的图形方法获得的,但是只有的下限,并且只有的上限。pDn1,n2+Dn1,n2

这些小样本方法需要路径枚举算法和/或递归关系,这无疑使渐近计算更为理想。Gibbons和Chakraborti还注意到,随着和接近无穷大,CDF受到限制:n1n2Dn1,n2

limn1,n2P(n1n2n1+n2Dn1,n2x)=12i=1(1)i1e2i2x2

他们给出(或)的限制CDF 为:Dn1,n2+Dn1,n2

limn1,n2P(n1n2n1+n2Dn1,n2+x)=1e2x2

由于和严格来说是非负的,因此CDF只能在采用非零值:D+D[0,)

$ D ^ {+} $(或$ D ^ {-} $)的CDF


参考文献
Gibbons,JD和Chakraborti,S.(1992)。非参数统计推断。Marcel Decker,Inc.,第三版,修订和扩展版。

霍奇斯,JL(1958)。Smirnov两样本检验的显着性概率。Arkivförmatematik。3(5):469--486。


1
实际的CDF随处可见,但对于,CDF将为零;您给出的函数形式仅适用于(这可以通过简单的推理(,0)x0P(D+<0)
得出
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.