分析前后治疗控制设计的最佳实践


53

想象以下通用设计:

  • 将100名参与者随机分配至治疗组或对照组
  • 因变量是数字的,并且在处理前后进行了测量

分析此类数据的三个显而易见的选择是:

  • 在混合方差分析中通过时间交互作用测试组
  • 做一个ANCOVA,条件为IV,前测为协变量,后测为DV
  • 做一个t检验,条件为IV,事前变更分数为DV

题:

  • 分析此类数据的最佳方法是什么?
  • 是否有理由倾向于一种方法而不是另一种方法?

1
当您说“条件”时,您是指小组作业吗?
pmgjones 2010年

1
@propofol:是的。如果我的语言不清楚,请您道歉。
Jeromy Anglim

1
还有用于统计评估单个观测值的时间数据的参数“ N-of-1”方法。示例应用:ncbi.nlm.nih.gov/pubmed/2039432比较方法:europepmc.org/abstract/MED/10557859/...
user31256

Answers:


34

关于这个话题(变化/得分)有大量文献,我认为最好的参考来自生物医学领域,例如

Senn,S(2007)。药物开发中的统计问题。威利(第7章第96-112章)

在生物医学研究,有趣的工作也已在研究中做了交叉试验(尤其是有关结转的影响,虽然我不知道这是你学习如何适用)。

从增益得分t到ANCOVA F(反之亦然),从Knapp和Schaffer那里,对ANCOVA vs.t方法(所谓的Lord悖论)进行了有趣的评论。根据Senn在他的文章“从基线开始变化和重新分析协方差”(Stat。Med。2006 25(24))中,不建议对更改分数进行简单分析,而将其设计为前后设计。此外,使用混合效果模型(例如考虑两个时间点之间的相关性)并不是更好,因为您确实需要使用“预”度量作为协变量来提高精度(通过调整)。非常简短:

  • ---
  • ANCOVA中使用的估算器的方差通常低于原始分数或变更分数的方差(除非前后的相关性等于1)。
  • 如果两组之间的前/后关系不同(斜率),那么与其他任何方法相比,问题就不那么多了(变化得分方法还假设两组之间的关系相同-平行斜率假设)。
  • 在治疗均等(根据结果)的零假设下,预期没有交互治疗x基线;拟合这样的模型很危险,但是在这种情况下,必须使用居中的基线(否则,将在协变量起点估算治疗效果)。

我也喜欢Edwards的《十个差异分数神话》,尽管它着重于不同背景下的差异分数。但是这里有一个带注释的参考书目,用于分析岗前变更(不幸的是,它没有涵盖最近的工作)。Van Breukelen还在随机和非随机环境中比较了ANOVA和ANCOVA,他的结论支持至少在随机研究中应优先考虑ANCOVA的想法(这防止了回归回归均值)。


只是要澄清一下:您是说以测试前分数作为协变量的ANCOVA是最佳选择吗?
mkt-恢复莫妮卡

17

丹尼尔·布莱特(Daniel B. Wright)在他的文章《与您的数据成为朋友》的第5节中对此进行了讨论。他建议(第130页):

在这种情况下,唯一正确的方法是对不同组的时间点2和时间点1的分数进行比较。在大多数情况下,您应该以几种方式分析数据。如果这些方法得出不同的结果,请更仔细地考虑每种方法所隐含的模型。

他建议以下文章作为进一步阅读:

  • Hand,DJ(1994)。解构统计问题。皇家统计学会杂志:A,157,317-356。
  • 勋爵(FM)(1967)。群体比较解释中的一个悖论。心理公报,72,304–305。免费PDF
  • Wainer,H。(1991)。调整差额基本利率:再次是洛德悖论。心理公报,109,147–151。免费PDF

9

最常见的策略是:

  1. 重复测量ANOVA,其中一个受试者内部因素(测试前与测试后)和一个受试者之间因素(治疗与对照)。
  2. 治疗后评分的ANCOVA,治疗前评分为协变量,治疗为独立变量。直觉上,想法是对两组之间的差异进行测试实际上就是您所追求的,并且与简单的t检验或ANOVA相比,将测试前的分数作为协变量包括可以提高功效。

我认为,关于这两种方法的解释,假设以及明显的自相矛盾的差异,还有更复杂的替代方案(尤其是当参与者无法随机分配治疗方案时)进行了很多讨论,但它们仍然很标准。

引起混淆的一个重要原因是,对于ANOVA,感兴趣的效果很可能是时间与治疗之间的相互作用,而不是治疗的主要效果。顺便说一句,此交互作用项的F检验将获得与独立样本t检验的增益分数(即,通过从每个参与者的测试后分数减去测试前分数获得的分数)完全相同的结果,因此您可能也去。

如果这一切太多,您将没有时间弄清楚,也无法从统计学家那里获得帮助,一种快速而肮脏的方法,但绝不是完全荒谬的方法,就是将测试后的分数与独立的样本t检验,忽略了检验前的值。仅当参与者实际上被随机分配到治疗组或对照组时才有意义。

最后,选择它本身并不是一个很好的理由,但是我怀疑上面的方法2(ANCOVA)是目前正确的心理学方法所采用的方法,因此,如果您选择其他方法,则可能必须详细解释该技术或证明其合理性。可以让自己相信的人,例如“已知得分不好”。


1
我要说的第一个建议,即重复测量方差分析,不适用于分析事前数据。基线时干预组中的治疗是否编码为0?无论哪种方式,这都会重新引入霍桑效应。控件之间的前/后系统差异会导致随机变化。如果在后期进行多次测量,则RM AN C OVA是合理的,并且基线值仍作为协变量进行调整或用作增益得分。
AdamO '17


-2

由于您有两种方法(特定项目或库存总和),因此没有理由考虑采用方差分析。配对t检验可能是合适的;可以帮助您选择所需的t检验。

您要查看特定于项目的结果还是总体得分?如果要进行项目分析,可能是一个有用的起点。


4
对照组呢?对所有数据进行配对t检验听起来是个坏主意,但肯定不能解决主要问题(治疗有效吗?)。仅限于治疗组的配对t检验是一个合理的策略,但忽略对照组会丢弃大量数据,并且提供的证据不足,表明干预措施实际上是有效成分。实际上,ANOVA是分析该设计的一种常用方法(即使经常受到批评)。
庆典
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.