哪些描述统计量不是效应大小?


12

维基百科

效果大小是现象强度的度量或该数量的基于样本的估计。根据数据计算出的效应大小是一种描述性统计数据,用于传达关系的估计量,而无需对数据中的表观关系是否反映总体中的真实关系做出任何声明。

为了更好地理解它,我想知道除图形和曲线图外,哪些描述性统计数字不是效应大小。


与效果大小度量相比,图形和图表实际上可以更直观地衡量效果的大小。如果您实际上在某些量度上看到了两组之间的重叠(大致对应于较小的d),则可能更容易意识到,显着差异并不意味着一组成员的得分都比另一组成员的得分低等等
晚会

Answers:


18

效果大小

  • 常见的标准化效果大小通常会量化关系或效果的数量或程度。最常见的效应量度可能是科恩(Cohen),皮尔逊(Pearson)和比值比(特别是对于二元预测变量)。
  • 不太常见的效果量度:也就是说,您可以有标准化和非标准化的效果量度。任何能传达关系程度且不受样本量特别污染的统计数据都可能是效应量度。因此,Beta系数,R平方,协方差,组之间的原始均值差等都可以反映效果程度。话虽如此,我发现有些研究人员盲目地运用了效应大小的度量,而忘记了更广泛的目标是使读者对效应​​的程度有所了解。因此,他们通常没有意识到均值差异或原始回归系数之类的度量在某种意义上是一种效应大小度量。盲目使用效果大小的另一个示例涉及使用效果大小度量,这些度量没有直观的解释,但已被一些教科书推荐。

没有效果大小:

  • 大多数测试统计数据不是效应大小。例如,卡方检验,t检验,z检验,F检验。随着人口效应规模的增加和样本规模的增加,它们都会变大。近年来,在很多方面都强调了效应大小的整个语言,因为研究人员过多地将注意力集中在测试统计量上,而不是效应大小上。当样本量很大时,即使很小的影响在统计上也很重要,这一点尤其重要。
  • 大多数单变量统计数据不是效应量。对于大多数目的,效果大小与至少两个变量之间的关系有关。因此,样本均值,标准差,偏斜,峰度,最小值,最大值等不是影响大小的度量。
  • 与关系程度无关的统计数据不是效应大小度量。例如,多变量正态性,矩阵的特征值等的测试通常不直接针对量化单词常识上的效果。

更广泛的考虑

  • 缩放注意事项:统计量作为效果大小量度的效用在很大程度上与它传达效果大小的能力有关。有时,这可以通过使用熟悉的标准化效果度量来实现(例如,cohen d)。在其他时候,仔细考虑变量的缩放比例可以更清楚地解释效果的大小。例如,假设我进行了一项针对收入水平培训计划的研究。我可以说培训计划使收入增加了0.2个标准差,或者我说培训计划使收入增加了3500美元。两者都是有用的。两者都是效果大小的度量。第一个是标准化的(cohen d),第二个是非标准化的(原始组均值差)。
  • 估计效应大小的精度:我们经常提取效应大小量度的样本估计值(例如,科恩的d,皮尔逊的r等)。这种情况可能导致重要性检验与效果量度的对比。尽管如此,目标仍然应该是以一种准确无偏的方式估计人口影响的大小。从常客的角度来看,效果大小周围的置信区间提供了精确度的估计。从贝叶斯角度看,效应大小具有后验密度。在许多情况下,需要注意确保使用的是公正的效果量度。

1
(+1)个好答案。
chl

第三点也是最后一点可能解释了Wikipedia文章的作者来自何处。考虑到对心理学的重视,我认为重点不是将效应大小与其他描述性统计数据进行对比,而是与检验统计量和p值(即推论统计数据)进行对比,并强调效应大小量度并不能说明抽样变异性。
晚会

非常感谢您的答复。但是,我有一个问题:您是说置信区间不能直接用作样本量吗?它不能用作效应量的度量吗?(通过置信区间,我的意思是将值添加到患病率,均值等中或从中减去)-而不是CI的上下限。
2013年

2
@Vic您可以对效果大小量度有一个置信区间,但是置信区间本身不是效果大小。
Jeromy Anglim 2013年

嗯,非常感谢亲爱的杰罗米。这些年来,我一直误会。:)
Vic

6

首先,效果大小既可以推论性地也可以描述性地使用。r和OR均为效应大小,并且肯定都用于推论统计中。

单变量统计量通常不是影响大小,尽管可以。例如,如果您要比较已婚男人和女人的年龄,则男人的平均年龄不是影响大小(那么均值之差就是一个影响大小)。但是,如果要查看某物的均值是否为0,则该均值将是效果大小。

如果衡量效果,那就是效果大小!


我猜@Peter是对的,但是效果大小是由Cohen定义的更狭窄的术语:(Mean1-Mean2)/ PooledSD。这听起来有点像差异是有意义的,或者仅是统计学上显着的-使用常用词来定义统计术语。
doug.numbers

2
科恩在哪里定义呢?如果您指的是他的《功率分析》一书,我认为他将其用作将其他效果大小转换为该类型的标准。但是那本书中的每张功率分析表(都有很多)都使用某种效果量(并非全部使用那个)
彼得·弗洛姆-恢复莫妮卡

1
科恩的d一直是我理解的方式。与en.wikipedia.org/wiki/Effect_size中所述类似。但是您绝对正确,有很多方法描述为效果大小。
doug.numbers

4
t检验和z检验不是效应量。对于不同的样本量,相同的效应量将产生实质上不同的t和z值。
Jeromy Anglim

1
@JeromyAnglim是正确的;+1。我编辑了答案
彼得·弗洛姆-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.