使用R?对Kruskal-Wallis或Mann-Whitney U检验的功效分析?


Answers:


3

计算功率当然是可能的。

更具体地说-如果您做出足够的假设来获得可以(以某种方式)计算拒绝概率的情况,则可以计算功效。

在Wilcoxon-Mann-Whitney中,如果(例如)假设分布形状(对分布形式进行假设),并对位置的比例(分布)和特定值或位置差异进行一些假设,您也许可以通过代数或通过数值积分来计算功效;否则您无法模拟拒绝率。

因此,例如,如果我们假设从分布中采样了指定的位置差异(针对通用标度进行了标准化),则给定样本大小,我们可以模拟满足所有这些条件的许多数据集,从而获得拒绝率的估计值。因此,假设我们有两个分布(位置比例系列)的样本,单位尺度()–不失一般性–位置差异为。同样,不失一般性,我们可以取。然后,对于某些指定的样本大小(例如),我们可以模拟观察值,从而模拟该特定值t5t5σ=1δ=μ2μ1=1μ1=0n1=6,n2=9δ/σ(即)。这是R中的一个简单示例:1

n1=6;n2=9;tdf=5;delta=1;al=0.05;nsim=10000
res = replicate(nsim,{y1=rt(n1,tdf);y2=rt(n2,tdf)+delta;wilcox.test(y1,y2)$p.value<=al})
mean(res)  # res will be logical ("TRUE" = reject); mean is rej rate

像这样的三个模拟产生了0.321、0.321和0.316的拒绝率。功效显然在0.32附近(您可以仅从这些模拟中的一个模拟计算出置信区间,因为拒绝计数是二项式的)。在实践中,我倾向于使用较大的模拟,但是如果要模拟许多不同的或,则可能不希望每个模拟都超过10000个模拟。δnδ

通过对许多位置偏移值执行此操作,即使您愿意,您甚至可以针对该组情况获得功率曲线。

在大样本加倍和会像减半(并因此增加在给定的),所以你可以经常得到各种好的近似从模拟在只有少数值。类似地,对于一个拖尾测试,如果是处的拒绝率,则 趋于在接近线性(再次,可以很好地近似)在各种从模拟在只有几个值的值Ñ 2 σ 2 δ / σ δ Ñ Ñ 1 - b δ = δ n1n2σ2δ/σδnn1biδ=δiΦ1(1b)δδδ(一打精心选择的值通常很丰富)。明智的平滑选择通常会在或其他值处产生显着良好的幂近似。nδ

当然,您不必局限于位置转移。您可以研究任何可能导致发生变化的参数更改。P(Y2>Y1)

请注意,虽然这些测试在零值下是无分布的(对于连续分布),但是在替代方案的不同分布假设下,行为是不同的。

Kruskal-Wallis的情况与此类似,但是您需要指定更多的位置偏移(或其他任何情况)。

答案中的曲线图显示了在特定的样本量下,成对的t检验的功率曲线有符号秩检验的模拟功率的比较,它跨越了各种标准化位置偏移,用于从正态分布中进行采样,并具有成对的指定相关性。可以对曼恩·惠特尼和克鲁斯卡尔·沃利斯进行类似的计算。


1

我有和你完全一样的问题。经过搜索后,我找到了这个包:https : //cran.r-project.org/web/packages/MultNonParam/MultNonParam.pdf

kwpower(nreps,shifts,distname = c(“ normal”,“ logistic”),level = 0.05,mc = 0,taylor = FALSE)

nreps:每组中的数字。

shifts:在替代假设下,各种总体的偏移量。

distname:基本观测值的分布;当前支持normal和logistic。

级别:测试级别。

mc:0表示渐近,正值表示mc近似值。泰勒:逻辑确定是否将泰勒级数逼近用于概率。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.