曼惠特尼U检验：效应大小的置信区间

根据弗里茨，莫里斯和Richler（2011;见下文），可被计算为使用下式的曼-惠特尼U检验的效果大小 $r$ 这是方便我，我报告在其他场合也。除了效果量度，我还要报告的置信区间。

r = \frac{z}{\sqrt{N}}

$r = \frac{z}{\sqrt N}$

r

$r$

r

$r$

这是我的问题：

我可以像皮尔逊的r一样计算r的置信区间，尽管它被用作非参数检验的效应量度？
一尾测试与二尾测试必须报告什么置信区间？

编辑有关第二个问题的内容：“单尾测试与两尾测试必须报告什么置信区间？”

我发现了一些其他信息，恕我直言可能会回答这个问题。“虽然两边的置信限形成一个置信区间，但它们的单边对应物被称为上下置信界限。” （http://en.wikipedia.org/wiki/Confidence_interval）。从这些信息中，我得出结论，重要性检验（例如检验）是一尾还是二尾不是主要问题，而是关于效应大小的CI感兴趣的信息是什么。我的结论（如果您不同意，请纠正我）： $t$

两侧CI 对上限和下限感兴趣（因此，尽管单尾显着性检验为p <.05，尤其是在值接近的情况下，两侧CI可能为0。 05.） $\rightarrow$
一侧的“ CI” 仅对上限或下限感兴趣（由于理论推理）；然而，在检验了有针对性的假设之后，这并不一定是主要关注的问题。如果将焦点放在效果大小的可能范围上，则双面CI则非常合适。对？ $\rightarrow$

弗里兹，莫里斯和里奇勒（Fritz，Morris，＆Richler（2011））的文字段落见下文，内容涉及我在上文中提到的曼·惠特尼检验的效应大小估计。

“我们在此描述的大多数效应量估计值都假设数据具有正态分布。但是，某些数据不满足参数检验的要求，例如，按序数而不是区间标度的数据。对于此类数据，研究人员通常使用非参数统计检验，例如曼恩·惠特尼检验和Wilcoxon检验，这些检验的重要性通常通过在样本量不太小的情况下将检验统计量的分布近似于分布来评估，而统计学包，如SPSS，运行这些测试报告适当除了为值值或 ; $z$ $z$ $U$ $T$ $z$ 也可以手工计算（例如，Siegel＆Castellan，1988）。所述值可以用于计算作用大小，如由科恩（1988）提出; Cohen的r准则是：大影响为0.5，中影响为0.3，小影响为0.1（Coolican，2009，第395页）。这是很容易计算，，或从这些值，因为 $z$ $r$ $r$ $r^2$ $\eta^2$ $z$ 和
$r = \frac{z}{\sqrt{N}}$ $r = \frac{z}{\sqrt N}$ 尽管公式中存在N，但这些效应大小的估计仍独立于样本大小。这是因为z对样本大小敏感。除以N的函数会从结果效应量估计中消除样本量的影响。”（第12页） $r^{2} o r η^{2} = \frac{z^{2}}{N}$ $r^2\quad{\rm or}\quad \eta^2 = \frac{z^2}{N}$

— 灰色
source

该文件可在此处免费获得。

— asac

Answers:

Mann-Whitney U检验的效果大小的一种选择是通用语言效果大小。对于Mann-Whitney U，这是支持既定假设的样本对的比例。

第二个选择是等级相关性。因为秩相关的范围是-1到+1，所以它具有类似于Pearson r的属性。另外，通过简单的差异公式，等级相关性是公共语言效果大小与其补语之间的差异，这一事实促进了解释。例如，如果有100个样本对，并且有70个样本对支持该假设，则公共语言效果量为70％，等级相关度为r = .70 = .30 = .40。Kerby在《创新教学：Kerby（2014）创新教学》杂志中明确讨论了通用语言效果的大小以及计算等级相关性的四个公式。

顺便说一句，尽管本文没有提及，但我可以肯定的是，Somers d和曼恩·惠特尼的等级相关性是等价的。

— DSK
source

您是说“例如，如果有100 对可能 ”吗？曼恩·惠特尼（Mann-Whitney）U检验用于未配对的数据，因此措词不明确-您可能想向读者说明可能的配对是什么。

— gung-恢复莫妮卡

感谢您的评论和澄清的机会。我指的是样本对。如果实验样品中有10个观察值，而对照样品中有10个观察值，则有10 * 10 = 100个样品对。根据罗伯特·格里索姆（Robert Grissom）的说法，样本的效应量是总体效应量的无偏估计量。因此，如果样本的秩相关为r = .40，则这是总体效应大小的无偏估计量。

— DSK 2015年

我怀疑这就是你的意思，@ DSK。我认为这种解释会帮助人们。您可能需要将其编辑为答案。欢迎来到简历。

— gung-恢复莫妮卡

您的链接使我有机会购买该文章。

$c$ Hmiscrcorr.cens $c$ $D_{xy}$ $D_{xy} = 2\times (c - \frac{1}{2})$

— 弗兰克·哈雷尔
source

感谢您将此通知我（链接）。我现在在问题中插入了曼·惠特尼测验中的段落。

— 2014年

非常感谢您的回答。您可能手边有一个有关如何解释c-index和Somers'D的链接？我特别想知道后者是否可以解释为与r相当。我有两个样本，第二个样本（N和正态分布较大）报告r。我认为，如果所使用的措施相似，则将使结果的比较更加容易-当然是尽可能的。这就是为什么我对Fritz等人提到的公式感兴趣的原因。（2011）。因此，他们的r的CI不能像我假设的Pearson的r那样计算？再次非常感谢！

— 2014年

z

$z$

D_{x y}

$D_{xy}$

Y

$Y$

D

$D$

c

$c$

非常感谢您的回复。我搜索了一些有关如何解释Somer的信息，但是到目前为止，我还没有取得太大的成就。可以将Somer的理解理解为与Pearson的相关系数类似，例如，对它进行平方可以得出确定系数吗？我很高兴找到一个效果大小量度，如果存在的话，它可以与r类似地解释。

— 2014年

我发现有关公式r = Z /√（N）的更多信息：Rosenthal（1991）写道：“只要我们知道研究的大小（N），我们就可以有效地从ap水平估算出效应大小r。我们使用Z值表将获得的p转换为其标准正态偏差当量。”

— 2014年