二项式效应大小显示(BESD)是否会误导效应大小?


10

我很难接受唐纳德·鲁宾(Donald Rubin)提出过一个真正的技巧。然而,这是我的BESD [感悟123 ]。

Rosenthal和Rubin(1982)的原始论文声称,显示“无论原始数据是连续的还是分类的,如何将任何产品-时刻的相关性重塑到这种[2x2]的显示器中”都是有价值的。

下表来自p。上方第二个链接451:

在此处输入图片说明

这项技术似乎夸大了几乎所有效果大小的大小。在这里,原始数据的 = .01,但是当“转换”为2x2列联表时,我们似乎要面对更大的影响。我并不否认,当以这种方式将数据重新转换为分类格式时,确实为.1,但是我觉得翻译中有些东西很失真。 ϕR2ϕ

我在这里错过真正有价值的东西吗?另外,我给人的印象是,在过去的十年左右的时间里,统计界普遍拒绝将此作为一种合法方法,我对此是否错?

分别计算实验()和控制()成功率()的方程式很简单:Ç 小号[RECsr

Esr=.50+r/2

Csr=.50r/2


参考:

Rosenthal,R。和Rubin,DB(1982)。一个简单的通用显示实验效果的大小。教育心理学杂志,74,166–169。


1
您找到答案了吗?我目前正在做一些模拟工作,看它是否有偏差,但是它是直接从计算的,因此我在BESD的点估计中没有任何偏差。我也有预感,这会高估效果,但是我也无法直言为什么。r
Mark White

您的好主意是我所见过的唯一反馈或答案。
rolando2

2
我没有读过它,但这似乎很相关:许,LM(2004)。二项式效应大小显示中显示的成功率差异的偏差。心理方法,9(2),183-197。在Randolph,JJ和Edmondson,RS(2005)中也讨论了一些批评。使用二项式效应大小显示(BESD)向评估对象呈现效应大小的大小。实践评估,研究与评估,10(14)。
沃尔夫冈·

Answers:


4

我可以证明它有偏见(我认为),但是我无法解释原因。我希望有人能看到我的答案并帮助进一步解释它。

就像在许多荟萃分析和您发布的图像中一样,许多人将BESD解释为:如果要对两个变量进行中值分割,则可以将人准确地放在2 x 2列联表的“正确”单元格中,并将百分比时间。

因此,如果,人们可能会说:“鉴于观察到的,您可以这样想:在X的中位数以上的人在70%的时间里也将在Y的中位数以上。 ” 这就是克劳斯(1995,第69页)的解释方式(他依赖一种假设情况,其中一个变量确实是二分法,而另一个变量是中位数拆分):r.50+r/2=.70r

在此处输入图片说明

人们也经常使用医学上的隐喻:“此对应于对照和实验条件下人们之间40%的差异。”r

为了查看中位数分割式解释是否有偏差,我模拟了1,000,000个案例的真实人口,其中真实人口。然后,我从该人群中抽出100个人,计算了BESD“正确率”(即),然后计算了2 x 2列联表的实际中位数拆分单元格,就像上面所述的用于分类的表一样人们“正确”。我做了10,000次。.50 + r / 2r=.38.50+r/2

然后,我对这些长度为10,000的向量的平均值和标准差进行了计算。编码:

library(MASS)
# set population params
mu <- rep(0,2)
Sigma <- matrix(.38, nrow=2, ncol=2) + diag(2)*.62
# set seed
set.seed(1839)
# generate population
pop <- as.data.frame(mvrnorm(n=1000000, mu=mu, Sigma=Sigma))
# initialize vectors
besd_correct <- c()
actual_correct <- c()
# actually break up raw data by median split, see how it works
for (i in 1:10000) {
  samp <- pop[sample(1:1000000, 100),]
  besd_correct[i] <- round(100*(.50 + cor(samp)[1,2]/2),0)
  samp$V1_split <- ifelse(samp$V1 > median(samp$V1), 1, 0)
  samp$V2_split <- ifelse(samp$V2 > median(samp$V2), 1, 0)
  actual_correct[i] <- with(samp, table(V1_split==V2_split))[[2]]
}
# cells for BESD
mean(besd_correct)
100 - mean(besd_correct)
# cells for actual 2 x 2 table with median split
mean(actual_correct)
100 - mean(actual_correct)

基于BESD,我们得到此表,其中v1和分别v2指变量lowhigh指中位数以下和上方:

+---------+--------+---------+
|         | v2 low | v2 high |
+---------+--------+---------+
| v1 low  | 69     | 31      |
+---------+--------+---------+
| v1 high | 31     | 69      |
+---------+--------+---------+

根据对原始数据的实际中位数拆分,我们得到以下表格:

+---------+--------+---------+
|         | v2 low | v2 high |
+---------+--------+---------+
| v1 low  | 62     | 38      |
+---------+--------+---------+
| v1 high | 38     | 62      |
+---------+--------+---------+

因此,尽管有人可能会使用BESD争论说,“对照和实验之间存在38个百分点的差异”,但实际的中位数拆分值为24。

我不确定为什么会发生这种情况,或者不确定是否取决于样本量和相关性(一个人可以轻松地进行更多的模拟来弄清楚),我认为这表明这是有偏见的。如果有人可以用数学(而不是计算)的解释来说明,我将很高兴。


2

马克·怀特的直觉是不正确的。BESD实际上并未对中位数拆分建模。中位数拆分与实际统计信息丢失相关-它会系统地减弱关系(请参阅http://psycnet.apa.org/record/1990-24322-001),这就是中位数拆分值显示出比BESD更低的准确性的原因。BESD证明了分类的准确性,就好像变量是真正的二分法,而不是通过中位数拆分而被人为二分法。要看到这一点,请计算中位数拆分数据的相关性。您将看到它小于原始变量的相关性。如果变量最初是二进制的,则这两种方法会一致。从本质上讲,BESD会显示变量,就好像它们是真正的二进制文件一样。当将其用于连续变量时,这必然表示一种抽象-实际上并没有“成功”和“失败”或“处理”和“控制”组,

BESD没有偏见。如果我们使用两个二进制变量,它可以准确反映特定处理方法对分类准确性的影响。它是展示某项措施或治疗措施潜在潜在价值的有用显示,是的,它确实表明,即使统计差异很小的影响也很有意义。BESD在应用的心理和组织实践中被广泛使用,并且与其他实际效果大小显示非常吻合(例如,使用具有r = .25效度相关性的量度从上至下选择组将导致.25选定组与未选定组相比,SD的预后表现有所提高。

由于平方运算是非线性的,所以统计数据的方差始终会导致误解,并且会低估变量关系的大小。许多应用方法论者(例如https://us.sagepub.com/en-us/nam/methods-of-meta-analysis/book240589)都强烈反对使用其平方根(更准确地传达了效果)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.