如何显示交叉(配对)实验的误差线


19

以下场景已成为调查者(I),审阅者/编辑者(R,与CRAN不相关)和我(M)这三者中的最常见问题解答,是情节创建者。我们可以假设(R)是典型的医学大老板评论者,他只知道每个图都必须有误差条,否则是错误的。当涉及到统计审查员时,问题就不那么重要了。

情境

在典型的药理交叉研究中,测试了两种药物A和B对葡萄糖水平的影响。每位患者均按随机顺序进行两次测试,并且假定没有残留。主要终点是葡萄糖(BA)之间的差异,我们假设配对t检验就足够了。

(I)想要显示两种情况下的绝对葡萄糖水平的图。他担心(R)对误差条的需求,并要求在条形图中出现标准误差。让我们不要在这里开始条形图战争。

条形图和SE葡萄糖两种治疗

(I):那不是真的。条形重叠,并且我们有p = 0.03?那不是我在高中学到的。

(M):我们在这里有一个配对的设计。要求的误差线完全不相关,计数的是配对差异的SE / CI,图中未显示。如果我可以选择,并且没有太多数据,那么我希望使用以下图表

连接线显示配对,点原始值

新增1:这是几个响应中提到的平行坐标图

(M):这些线显示了配对,并且大多数线都向上,这是正确的印象,因为斜率才是最重要的(好吧,这是绝对的,尽管如此)。

(I):那张照片令人困惑。没有人理解它,并且没有错误条(R在潜伏)。

(M):我们还可以添加另一个图,以显示差异的相关置信区间。距零线的距离给人以效果大小的印象。

(I):没人做

(R):它浪费了珍贵的树木

(男):(作为一个好德国人):是的,在树上指点了。但是,当我们进行多种处理和多种对比时,我还是会使用它(并且永远不会将其发布)。

差异的置信区间

什么建议吗?如果要创建绘图,R代码在下面。

# Graphics for Crossover experiments
library(ggplot2)
library(plyr)
theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines")))
n = 20
effect = 5 
set.seed(4711)
glu0 = rnorm(n,120,30)
glu1 = glu0 + rnorm(n,effect,7)
dt = data.frame(patient = rep(paste0("P",10:(9+n))),              
                treatment = rep(c("A","B"), each=n),glucose = c(glu0,glu1))

dt1 = ddply(dt,.(treatment), function(x){
  data.frame(glucose = mean(x$glucose), se = sqrt(var(x$glucose)/nrow(x)) )})

tt = t.test(glucose~treatment,paired=TRUE,data=dt,conf.int=TRUE)
dt2 = data.frame(diff = -tt$estimate,low=-tt$conf.int[2], up=-tt$conf.int[1])
p = paste("p =",signif(tt$p.value,2))

png(height=300,width=300)
ggplot(dt1, aes(x=treatment, y=glucose, fill=treatment))+      
  geom_bar(stat="identity")+  
  geom_errorbar(aes(ymin=glucose-se, ymax=glucose+se),size=1., width=0.3)+
  geom_text(aes(1.5,150),label=p,size=6)

ggplot(dt,aes(x=treatment,y=glucose, group=patient))+ylim(0,190)+
  geom_line()+geom_point(size=4.5)+
  geom_text(aes(1.5,60),label=p,size=6)

ggplot(dt2,aes(x="",y=diff))+
  geom_errorbar(aes(ymin=low,ymax=up),size=1.5,width=0.2)+ 
  geom_text(aes(1,-0.8),label=p,size=6)+
  ylab("95% CI of difference glucose B-A")+  ylim(-10,10)+
  theme(panel.border=element_blank(), panel.grid.major.x=element_blank(),
         panel.grid.major.y=element_line(size=1,colour="grey88"))

dev.off()

哦,我的天哪@ dieter-menne,好问题!它取决于您向其提交文章的日记类型。我将远离图战争,但我喜欢图2和图3:在很小的空间中有太多的信息。
doug.numbers

4
Masson和Loftus(2003)经常被引用。他们显示了示例图,在其中将同一图的第二个面板中差异的CI进行了面板划分。我不知道这是否会让马戏团的每个人都开心(我为您感到!)
Andy W

谢谢@AndyW提供的参考。说到重点,但有一个问题:它来自心理学。与医学评论家相比,心理学家有更多关于该主题的出色论文,他们具有更好的统计背景。我希望我能找到一些有关该主题的高级期刊指南,那是我能处理的唯一一把利剑。
Dieter Menne

Answers:


17

您完全正确的假设是,代表均值标准误差的误差线完全不适合受试者内部设计。但是,重叠的误差线和重要性的问题是另一个主题,在这个带有注释的参考列表的末尾,我将再次谈到这个问题。

心理学上有很多关于受试者内部置信区间或误差线的文献,它们确实可以满足您的需求。参考工作显然是:

Loftus,GR和Masson,MEJ(1994)。在受试者内部设计中使用置信区间心理研究与评论,1(4),476–490。DOI:10.3758 / BF03210951

但是,他们的问题是,对于主题内因素的所有级别,他们都使用相同的误差项。对于您的案例(2个级别),这似乎不是一个大问题。但是,有更多现代方法可以解决此问题。最为显着地:

Franz,V.和Loftus,G.(2012)。受试者内部设计中的标准误差和置信区间:Loftus和Masson(1994)的一般化,并避免了替代账户的偏见心理公告与评论,1-10。doi:10.3758 / s13423-012-0230-1

Baguley,T.(2011年)。计算和绘制ANOVA的受试者内部置信区间。行为研究方法。doi:10.3758 / s13428-011-0123-7 [ 可在此处找到 ]

在后两篇文章中可以找到更多参考(我认为都值得一读)。


研究人员如何解释CI?根据以下论文是不好的:

Belia,S.,Fidler,F.,Williams,J.,&Cumming,G.(2005年)。研究人员误解了置信区间和标准误码心理方法,10(4),389–396。doi:10.1037 / 1082-989X.10.4.389

我们应该如何解释重叠和不重叠的配置项?

卡明(G.)和芬奇(S.)(2005)。眼睛推断:置信区间和如何读取数据图片美国心理学家,60(2),170-180。doi:10.1037 / 0003-066X.60.2.170


最后一个想法(尽管这与您的情况无关):如果在一个图中具有分割图设计(即,对象内部和对象之间的因素),则您可能会完全忘记误差线。我会(谦虚地)raw.means.plot在R包中推荐我的功能plotrix


2
非常有用的参考清单。卡明(Cumming)在amazon.com/Understanding-New-Statistics-Meta-Analysis-ebook/dp/…中汇集了他的许多想法(无论您想说什么“新统计”,我都可能同意。)
尼克Cox


@amoeba我引用的Baguley纸使用了Morey纸技术。
亨里克

10

问题似乎与误差线无关,而与绘制配对数据的最佳方式无关。

从本质上讲,这里的误差线最多是总结不确定性的一种方式:它们不会,而且也不一定能够说出数据中的任何精细结构。

问题中提到了平行坐标图-有时称为轮廓图,该术语在不同领域中表示不同事物。@Ray Koopman已经建议了基本的散点图。

AB(A+B)/2A+B

此图的另一个来源是Neyman,J.,Scott,EL和Shane,CD1953。关于星系的空间分布:一个特定的模型。天体物理学杂志 117:92-133。

从广义上讲,此类图类似于绘制残差与拟合图的想法,图基和他的姐夫平方的安斯康比也很普遍。

AB=0A=BAB

可以忽略的设计是McNeil,DR 1992的平行线图。美国统计学家 46:307-310。在下面的两个参考文献中也对此进行了讨论。

与Stata相关的评论,其中有几篇参考资料

2004年,绘图协议和不同意。Stata Journal 4:329-349。

.pdf可从http://www.stata-journal.com/sjpdf.html?articlenum=gr0005访问

成对,平行或轮廓图,用于更改,关联和其他比较。Stata Journal 9:621-639。

.pdf可从http://www.stata-journal.com/sjpdf.html?articlenum=gr0041访问

非Stata用户应该能够通过Stata代码跳过和随意滚动,同时可以研究如何在自己喜欢的软件中实现图形。

AB


4

尝试散布各个(A,B)点的散点图。它们中的大多数应仅位于对角线的一侧(线A = B)。误差棒有两个类似物。相当于均值CI的常规值将是均值置信区间。带将是两条线之间的区域,两条线都平行于对角线。当且仅当带的两个边缘都位于对角线的同一侧时,配对t检验才有意义。

更保守的误差线类似物将是质心的置信椭圆。


1
cmethodBcmethodA

不,cl。-:)临床化学太复杂了。可能是您在“那里”添加了一些参考;我不确定你在说什么纸。
Dieter Menne

4

初步摘要:

Masson / Loftus非常详尽,对于不愿接受“互动”之类的医学同事而言,阅读起来并不容易。他们还对多重比较提出了一些建议,这些建议表明,当人们不想大量简化时,很难说明成对的置信区间。

马森·洛夫特斯

我不喜欢这种风格:带有错误条的条看起来很近千年。但是,它们还使用了稍微更优雅的样式:

Masson Loftus(无杠)

卡明/芬奇贝利亚等。必读。第一种是给您的朋友,当他看到互动一词时就颤抖的最佳选择。阅读该文章后,我订购了卡明的书。第二个显示了我将在Shiny中 为下一次医学研究人员会议实施的测试。

卡明/雀科

即使有第二条我从未使用过的轴,我也喜欢这张图。检查Henrik和其他人在StackOverflow上的贡献,以获取基于R的图形方法。我宁愿将第二个轴放在差异的左侧,以绝对清楚地表明值已更改,并可能添加了一个p值轴。

有人从晶格/ ggplot分数中射击吗?所有提供的解决方案都是基本图形,而不是可面板化/面子化的。

但是:请注意,评论和论文主要来自心理学系(以及来自核心化学的@cbeleites)。从医学期刊的评论者那里获得评论是一件好事。


0

为什么不只是为每个患者绘制差异*?然后,您可以使用直方图,箱形图或正态概率图,并为差异覆盖95%的置信区间。

  • 在某些情况下,可能是对数的差异。参见,例如,Patterson&Jones,“临床药理学中的生物等效性和统计学”,查普曼,2006年。

为什么不?它可能会提供有效的信息,但是带有单个点或成对点的图在医学研究中并不真正流行。这就是为什么平行绘图(提供更多信息)如此受欢迎的原因。医学研究人员需要平均值和“正常范围”(无论是什么)。
Dieter Menne
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.