Kolmogorov–Smirnov检验有一个简单的等效检验版本吗?


13

是否对Kolmogorov-Smirnov检验设计了两个等效的单面检验(TOST),以检验两个分布至少相差某个研究人员指定水平的否定主义原假设?

如果不是TOST,那么是否进行其他形式的等效测试?

尼克·斯汤纳(Nick Stauner)明智地指出,(我应该已经知道;)还有其他非参数TOST等价检验,用于随机等价的零假设,并且在更严格的假设下,还包括中位数等价物。


Answers:


9

好的,这是我的第一次尝试。仔细审查和评论表示赞赏!

二样本假设
如果我们可以对两样本单边Kolmogorov-Smirnov假设检验进行框架化,则可以沿着这些直线使用零假设和替代假设:

H,和0FY(t)FX(t)

H,至少持续一个,其中: tAFY(t)<FX(t)t

  • 测试统计量 对应于H;0:  ˚F Ý˚F XD=|mint(FY(t)FX(t))|0FY(t)FX(t)

  • 测试统计量 对应于H;和0:  ˚F Ý˚F XD+=|maxt(FY(t)FX(t))|0FY(t)FX(t)

  • F Xt Y XFY(t)和是样本和的经验CDFFX(t)YX

那么就应该沿着这些直线为等价检验创建一个一般的区间假设(假设当前的等价区间是对称的):

H,和0|FY(t)FX(t)|Δ

H,至少持续。A|FY(t)FX(t)|<Δt

这将转化的特定双单侧“否定”零假设来测试等价(这两个假设采取相同的形式,因为 和是严格非负): d -D+D

H,或01D+Δ

H。02DΔ

拒绝两个 ħ ħ将导致一个得出这样的结论。当然,等价区间不必是对称的,对于各自的单面零假设,和可以替换为(下)和(上)。- 02 -Δ<˚Fý-˚FX<Δ-ΔΔΔ2Δ101 02Δ<FY(t)FX(t)<ΔΔΔΔ2Δ1

检验统计量(更新:增量绝对值符号外)
的测试统计和(离开和隐含的)分别对应于H和H,分别是: D 2 n Y n X 01 02D1+D2nYnX0102

D1+=ΔD+=Δ|maxt[(FY(t)FX(t))]|

D2=ΔD=Δ|mint[(FY(t)FX(t))]|

等价/相关性阈值如果使用非对称等价间隔,则
间隔或以和为单位表示或不同概率的大小。作为和的方法无穷大,的CDF为接近为,以及用于:[ Δ 2Δ 1 ] d + d - ñ ý Ñ X d + d - ñ ŸÑ X 0 < 0 0[Δ,Δ][Δ2,Δ1]D+DnYnXD+DnY,nX0t<0t0

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

$ D ^ {+} $(或$ D ^ {-} $)的CDF

因此我认为对于样本大小缩放的PDF(或样本大小缩放)必须是为,以及用于: d - 0 < 0 0D+D0t<0t0

f(t)=1e2t2ddt=4te2t2

$ D ^ {+} $(或$ D ^ {-} $)的PDF

Glen_b指出,这是具有的瑞利分布。因此,样本规模缩放的和的大样本分位数函数为: d+d-σ=12D+D

CDF1=Q(p)=ln(1p)2

而的自由选择可能是临界值,更严格的选择是临界值。Q α + σ / 2 = Q α + 1Δ Qα+σ/4=Qα+1Qα+σ/2=Qα+14Qα+σ/4=Qα+18


1
在您从cdf传递到pdf的那一行中,我认为您错了。令,所以(滥用表示法),在极限。然后(注意之后的)。(请注意在取导数上方的行中的指数中缺少一个符号。同样我不确定为什么在那儿有一个积分符号,但也许我误解了。)Pķ=1-ë-22˚Fķ=dKnY,nX=nYnXnY+nXD+P(K,t)=1e2t2fK(t)=ddt1e2t2=4te2t24t4
Glen_b-恢复莫妮卡2014年

2
@stochazesthai和是两个单方面的测试统计信息。对于TOST,您需要同时拒绝这些检验统计信息适用的所有零假设。是上一行CDF的临界值,您想在其中用代替(例如)。的选择取决于在得出相关差异(例如,自由的“等效性”为之前)需要经过(对于普通的旧实证主义者的临界拒绝值)有多远。 d 2 Q α - 1 1 - α p Q α = D1D2Qα11αp ΔQαħ01Qα=ln(1(1α))2ΔQαH0 σQα14 σ超出)。Qα
亚历克西斯

2
@stochazesthai(继续),所以如果这两个 和,那么你拒绝。d 2Δ ħ - 0D1ΔD2ΔH0
亚历克西斯

2
@stochazesthai哎呀!我应该在引号后面加上“ 自由 ”一词,而不是等价地再加上两个评论。:)
亚历克西斯(Alexis)2015年

2
@stochazesthai如果,则拒绝,如果,则无法拒绝。如果,则拒绝;如果,则无法拒绝。如果同时拒绝和,则拒绝,否则无法拒绝。D1Δ d 1 < Δ ħ - 01 d 2Δ ħ - 02 d 2 < Δ ħ - 02 ħ - 01 ħH01D1<ΔH01D2ΔH02D2<ΔH02H01H02H0H0
亚历克西斯

6

等值测试中TOST的替代方法基于置信区间方法:

令表示预定的等价裕度和 未知基础分布函数之间的Kolmogorov-Smirnov距离。Δ

θ:=supt|FX(t)FY(t)|

现在,如果的90%置信区间完全在,那么我们可以95%地确定足够接近于0来表示“等效性”。θ[Δ,Δ]θ

在不知道基本分布的情况下,似乎无法获得近似的分析置信区间,因此我们可能需要基于对和重采样,依靠(经偏置校正)自举置信区间。(不过,我不想在此特定应用程序中找到其有效性的条件...)ÿXY


优秀。您是否引用任何接受的CI (引导程序或其他方法)的人?Dn1,n2
亚历克西斯

1
好点...简短的论文tomswebpage.net/images/K-S_test.doc提到“ David J.Sheskin撰写的第五版参数和非参数统计程序手册(2011年4月27日)”。为D提供两个样本的案例解释。但是目前,我没有这本书的访问权限。
Michael M
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.