效果大小指标的Cohen d和对冲g之间的差异


19

对于效果大小分析,我注意到Cohen的d,对冲的g和对冲的g *之间存在差异。

  • 这三个指标通常非常相似吗?
  • 他们会产生不同结果的情况如何?
  • 还是我使用或报告的偏好问题?

1
如果可能对潜在的回答者公式有用,请在此处列出:en.wikipedia.org/wiki/Effect_size
Jeromy Anglim

在R中模拟n1,n2,s1,s2和总体差异的方法会很不错。任何人?
Jeromy Anglim

1
这里也介绍了该材料:Hedges的g和Cohen的d有什么区别
gung-恢复莫妮卡

Answers:


18

Cohen d和Hedges的g池方差均基于总体方差的假设,但是对于每个样本,使用n-1而不是n的g池,可以提供更好的估计,尤其是样本量较小时。d和g都略有正向偏差,但对于中等或较大的样本量而言可以忽略不计。使用g *减小偏差。Glass的d假定不具有相等的方差,因此它使用对照组或基线比较组的sd作为这两个均值之差的标准。

我的书中详细讨论了这些效果大小以及Cliff和其他非参数效果大小:

Grissom,RJ和Kim,J.J.(2005)。研究的影响大小:广泛的实践方法。新泽西州Mahwah:艾尔鲍姆。


8

据我了解,Hedges的g是Cohen d(合并SD)的精确度更高的版本,因为我们为小样本添加了校正因子。这两项措施的普遍认同时,同方差的假设不受侵犯,但我们可以发现的情况下这种情况并非如此,例如见麦格拉思和迈耶,心理学的方法 2006年,11(4):386-401(PDF)。我的答复末尾列出了其他论文。

我通常发现,几乎在所有心理学或生物医学研究中,这都是科恩氏病的报道。这可能与众所周知的经验法则来解释其大小有关(Cohen,1988)。我不知道有任何关于Hedges的g(或Cliff delta作为非参数替代)的论文。布鲁斯·汤普森(Bruce Thompson)对APA部分的效果大小进行了修订

搜寻有关效果大小量度的蒙特卡洛研究,我发现本文可能很有趣(我只阅读摘要和仿真设置):效果大小的鲁棒置信区间:非正态下Cohen d和Cliff Delta的比较研究和异构方差(pdf)。

关于您的第二条评论,MBESSR软件包包括用于ES计算的各种实用程序(例如,smd以及相关功能)。

其他参考

  1. Zakzanis,KK(2001)。能够说出真相,全部真相的统计信息,只有真相:公式,说明性的数值示例以及对神经心理学研究人员的效应大小分析的启发式解释。临床神经心理学档案,16(7),653-667。(pdf
  2. Durlak,JA(2009)。如何选择,计算和解释效果大小。儿科心理学杂志pdf

2
一位匿名用户希望为那些不熟悉该术语的人添加以下同调定义:“一组随机变量的属性,其中每个变量具有相同的有限方差”。
gung-恢复莫妮卡

5

似乎当人们说科恩(Cohen)时,他们的意思主要是:

d=X¯1个-X¯2s

其中是合并的标准偏差,s

s=X1个-X¯1个2+X2-X¯22ñ1个+ñ2-2

对于合并的标准偏差,还有其他估计量,除了上述以外,可能最常见的是:

s=X1个-X¯1个2+X2-X¯22ñ1个+ñ2

这里的表示法明显不一致,但有时人们会说(即版本)版本称为Cohen的,并为使用的版本保留名称Hedge's(即通过Bessel修正, n1 + n2−2版本)。这有点怪异,因为科恩在对冲写出标准差之前(例如,科恩,1977年,第67页的版本)概述了合并标准差的两个估计量(对冲,1981年)。sñ1个+ñ2dGss

其他时间,Hedge的g被保留以指代Hedges开发的标准化均值偏差的任一偏差校正版本。Hedges(1981)表明,Cohen的d偏向上(即,其期望值高于真实总体参数值),尤其是在小样本中,并提出了一个校正系数来校正Cohen的d偏:

对冲的g(无偏估计量):

G=dΓdF/2dF/2ΓdF-1个/2
其中为一个独立的组设计,并且是伽马函数。(最初是《 Hedges 1981》,此版本是根据《 Hedges and Olkin 1985》第104页开发的)dF=ñ1个+ñ2-2Γ

但是,此校正因子在计算上相当复杂,因此,Hedges还提供了计算上的微不足道的近似值,尽管仍然略有偏差,但对于几乎所有可以想到的目的来说都很好:

对冲的(计算上的平凡近似):G

G=d1个-34dF-1个
其中,对于独立组设计,。dF=ñ1个+ñ2-2

(最初来自《 Hedges》,1981年,此版本来自Borenstein,Hedges,Higgins和Rothstein,2011年,第27页)

但是,至于人们说科恩的d与对冲的g相对于g *的含义,人们似乎将这三个估计量中的任何一个都称为对冲的g或科恩的d,尽管我从未见过有人写过“非方法/统计研究论文中的“ ”。如果有人说“无偏Cohen的d”,那么您只需要对后两个中的任意一个进行最佳猜测即可(而且我认为可能甚至还有另一种近似值已用于Hedge的!)。GG

如果左右,它们实际上都是相同的,并且都可以用相同的方式解释。出于所有实际目的,除非您要处理的样本量很小,否则使用哪种方法都无关紧要(尽管可以选择,也可以使用我称为对冲g的方法)没有偏见)。ñ>20

参考文献:

Borenstein,M.,Hedges,LV,Higgins,JP和Rothstein,HR(2011)。荟萃分析简介。英国西萨塞克斯郡:John Wiley&Sons。

Cohen,J。(1977)。行为科学的统计功效分析(第二版)。美国新泽西州希尔斯代尔市:Lawrence Erlbaum Associates,Inc.

Hedges,LV(1981)。Glass的效应大小估计量和相关估计量的分布理论。教育统计杂志,6(2),107-128。doi:10.3102 / 10769986006002107

Hedges LV,Olkin I.(1985)。荟萃分析的统计方法。加利福尼亚州圣地亚哥:学术出版社


3

如果您只是想像我一样理解Hedges的g的基本含义,那么您可能还会发现以下帮助:

使用Cohen(1988 [2])的惯例可以将对冲的g的大小解释为小(0.2),中(0.5)和大(0.8)。[1]

他们的定义简短明了:

Hedges'g是Cohen d的一种变体,可纠正由于样本量较小而产生的偏差(Hedges&Olkin,1985)。[1]脚注

我希望统计专家对此进行编辑,以便在中小(0.2)(0.5)和大(0.8)声明中添加任何重要的警告,以帮助非专家避免误解社会科学和心理学研究中使用的对冲g数。

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/基于正念疗法对焦虑和抑郁的影响:荟萃分析综述Stefan G. Hofmann,Alice T. Sawyer, Ashley A. Witt和Diana Oh。J咨询临床心理学家。2010年4月;78(2):169–183。doi:10.1037 / a0018555

[2] Cohen J.行为科学的统计功效分析。第二版。以太坊; 新泽西州希尔斯代尔:1988年(引[1])。


4
+1。回复:中小型,作为第一步,如果您没有任何相关知识或背景,那么这些“ T恤尺寸”是可以的,但实际上,根据学科或主题的不同,大小的影响会有所不同。而且,仅仅因为一个效果是“巨大的”并不一定意味着它实际上是重要的或理论上有意义的。
gung-恢复莫妮卡

1

其他海报涉及g和d之间的异同问题。除此之外,一些学者确实认为Cohen提供的效果大小值过于宽泛,导致对弱效果的过度解释。它们也不与r挂钩,从而导致学者可能来回转换以获得更有利地解释的效应大小的可能性。弗格森(Ferguson,2009年,《专业心理学:研究与实践》)建议使用以下值来解释g:

.41,作为“实用意义”的建议最低要求。1.15,效果中等2.70,效果强

这些显然要严格得多/困难得多,而且没有多少社会科学实验能取得显著成效……这大概应该是这样。


0

布鲁斯·汤普森(Bruce Thompson)确实警告过要使用Cohen(0.2)的中小(0.5)和中号(0.8)。科恩从未打算将这些用作严格的解释。所有效果大小都必须根据相关文献的背景进行解释。如果您正在分析有关主题报告的相关效果大小,并且它们的大小为(0.1)(0.3)(0.24),并且您产生的效果为(0.4),则可能是“大”。相反,如果所有相关文献都具有(0.5)(0.6)(0.7)的效果,而您具有(0.4)的效果,则可以认为它很小。我知道这是一个简单的例子,但绝对重要。我相信汤普森曾经在一篇论文中说过:“在比较效应大小的解释和当时社会科学家如何解释p值时,我们只会愚蠢”。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.