配对与非配对t检验


20

假设我有20只老鼠。我以某种方式配对了老鼠,所以我得到了10对。出于这个问题的目的,它可能是随机配对,或者可能是明智的配对,例如试图配对来自同一窝,同性别,体重相似的小鼠,或者可能是故意的愚蠢配对,例如尝试将体重不相等的老鼠配对。然后,我使用随机数将每对中的一只鼠标分配给对照组,另一只鼠标分配给待治疗组。我现在做实验,只治疗要治疗的小鼠,否则不理会刚才的安排。

当要分析结果时,可以使用未配对的t检验或配对的t检验。答案会以什么方式(如果有)不同?(我基本上对需要估计的任何统计参数的系统差异感兴趣。)

我之所以这样问,是因为我最近参与的一篇论文被生物学家批评为使用配对t检验而不是未配对t检验。当然,在实际实验中,这种情况并不像我所描述的那样极端,我认为配对是有充分理由的。但是生物学家不同意。

在我看来,在我绘制的情况下,即使配对不合适,也无法通过配对t检验而不是未配对检验来错误地提高统计显着性(降低p值)。但是,如果小鼠配对不当,可能会使统计意义恶化。这是正确的吗?

Answers:


23

我同意弗兰克(Frank)和彼得(Peter)的观点,但我认为有一个简单的公式可以成为问题的核心,OP值得考虑。

令和为两个随机变量,其相关性未知。ÿXÿ

ž=X-ÿ

的方差是多少?ž

这是简单的公式: 如果(即正相关)怎么办?Cov X Y > 0 X Y

Varž=VarX+Varÿ-2冠状病毒Xÿ
冠状病毒Xÿ>0Xÿ

然后t X i A Y i AVarž<Var(X)+Var(Y)。在这种情况下,如果由于正相关进行配对(例如,当您在干预之前和之后与同一个对象打交道时),配对将有所帮助,因为独立配对差异的方差低于未配对情况下的方差。该方法减少了方差。该测试功能更强大。这可以通过循环数据得到显着显示。我在书中看到一个例子,他们想看看华盛顿特区的温度是否高于纽约市的温度。因此,他们将这两个城市的平均每月气温取为2年。当然,由于四个季节,一年中会有很大的差异。对于未配对的t检验,这种变化太大,无法检测出差异。但是,基于同一年同一月份的配对消除了这种季节性影响,并且配对t检验清楚地表明,华盛顿特区的平均气温往往高于纽约。(月份纽约州的温度)和(月份华盛顿州的温度)呈正相关,因为NY和DC的季节相同,而且城市距离足够近,因此它们经常会遇到影响温度的相同天气系统。DC可能更温暖,因为它位于更南的地方。XiAYiA

注意,协方差或相关性越大,方差的减少就越大。

现在假设为负。Cov(X,Y)

然后。 现在配对会比不配对更糟糕,因为差异实际上会增加!Var(Z)>Var(X)+Var(Y)

当和不相关时,使用哪种方法可能并不重要。彼得的随机配对情况就是这种情况。ÿXY


3
Michael,因为“ <”和“>”在网页上有特殊含义,为避免大量文本从视图中消失,您必须在方程式中使用标记(代码为“ \ lt ”和“ \ gt”)。我标记了两个方程式给您造成了这个问题。将来,请在发布后立即阅读您发布的内容,以确保人们看到了您认为的内容,然后,如果标记存在问题,请随时标记您的帖子以引起管理员注意。TEX
ub

@whuber谢谢。我通常会在发布期间和发布之后进行检查,因为我发现方程式混乱很多,尤其是在下标时。错过这件事很不寻常,可能是因为那篇文章很长,而我只是粗心地做了其他我想要或需要做的事情。有时候,电话打扰了我,我忘了检查。关于导致文本在帖子中消失的特殊符号,我注意到了。我认为一个简单的解决方案是确保在符号后留一个空格。我认为过去对我有用。
Michael R. Chernick 2012年

+1,真的很准。请注意,如果样本中和完全不相关,则。Y Var Z = Var X + Var Y XÿVarž=VarX+Varÿ
gung-恢复莫妮卡

@MichaelChernick对于Cov(X,Y)<0的情况,我有一个问题:如果我的目标是从实验中推断E [X] -E [Y],那么即使我进行配对研究,分析我的数据,我仍然可以假装我的实验结果是UNPAIRED随机实验的实现。我可以这样做吗?因为如果您确实进行了未配对的随机实验,那么您可以从字面上获得相同的结果。然后,我可以取每组的平均值(忽略配对数据),并取两组平均值的差。这是E [Z]的无偏估计。对于我的估算器的差异,我只使用...
KevinKim

@MichaelChernick X组和Y组的样本方差并总结出来
KevinKim,

7

与其配对,不如了解基础数据模型,可能更好。如果进行配对以处理不受控制的异质性,通常情况下(双胞胎研究除外),配对仅部分控制这种变异性来源,而多元回归会更好。这是因为对连续变量进行匹配经常会导致残差,因为无法对此类变量进行精确匹配。


2
如果我们都应该进行回归分析,那么为什么实验设计的书籍(如David Cox的书籍)强调生物实验中配对或分组的重要性?配对避免了回归中必然存在的线性相关性的隐含假设。但是也许还有其他原因:有人吗?
David Epstein 2012年

6

两种测试(配对和未配对)会提出不同的问题,以便获得不同的答案。正确配对几乎总是比未配对更强大-这才是真正的配对点。因此,由于您说的是正确的配对,因此配对测试的p值很可能低于未配对的相同数据的p值。当然,您可以同时做两个,然后自己看看。

因此,解决难题的方法是实质性的,而不是统计性的。你的配对对吗?

您能从随机配对中获得比未配对测试更有意义的结果吗?让我们来看看:

set.seed(2910110192)
x <- rnorm(100, 10, 2)
y <- rnorm(100, 10, 2)
t.test(x, y)
t.test(x, y, paired = T)

是的,您可以,尽管此处的差异很小,但配对的p较低。我多次运行该代码。并不奇怪,有时一个p较低,有时另一个较低,但是在所有情况下,差异都很小。但是,我确信在某些情况下p值的差异可能会很大。


感谢您的回答,但我的问题要求系统上的区别。显然,在x和y的长期运行中,x和y有时看起来好像配对非常好,有时看起来好像是故意配对不好。当然,在随机选择x和y时,两个测试中p值的分布是否相同,这是一个统计问题。我想对于一个比我了解更多理论统计数据的人来说,要实际计算p值的两个理论分布应该不会太困难。我的猜测是它们是相同的。
David Epstein 2012年

在我实际参与的情况下,未配对的p值约为.04,而配对的.p约为p。根据生物学家的批评,我们应该引用.04。据我说,p值的提高强烈表明我们的配对有效。我声称这里的统计资料中有一个客观的问题,有一个客观的答案,而不仅仅是对特定配对的有效性进行良好的生物学判断的问题-后者似乎是Peter Flom和批判生物学家。
David Epstein

1
我认为统计数字可以说明问题。两种结果都应披露,但只要数据正确且可以说明相关性,配对测试就更准确,因为它考虑了相关性。
Michael R. Chernick

5

现在,我更好地了解了让我担心配对t检验与未配对t检验以及相关的p值的问题。发现是一个有趣的旅程,并且一路上有许多惊喜。对迈克尔的贡献进行的调查令人惊讶。就实践建议而言,这是无可指责的。此外,他说了我认为几乎所有统计学家都相信的观点,并且他有几项支持这一观点的投票。但是,从理论上讲,这实际上并不正确。我通过制定p值的公式,然后仔细考虑如何使用公式得出反例来发现了这一点。我是经过培训的数学家,而反例是“数学家的反例”。实际统计中不会遇到这种情况, 当我问最初的问题时,我试图找到的那种东西。

这是提供反示例的R代码:

vLength <- 10; meanDiff <-10^9; numSamples <- 3;
pv <- function(vLength,meanDiff) {
    X <- rnorm(vLength)
    Y <- X - meanDiff + rnorm(vLength,sd=0.0001)
    Paired <- t.test(X,Y,var.equal=T,paired=T)
    NotPaired <- t.test(X,Y,var.equal=T,paired=F)
    c(Paired$p.value,NotPaired$p.value,cov(X,Y))
}
ans <- replicate(numSamples,pv(vLength,meanDiff))

请注意以下特征:X和Y是两个10元组,它们的差很大并且几乎恒定。对许多有效数字而言,相关系数为1.000。...未配对测试的p值比配对测试的p值小10 ^ 40倍。因此,这与迈克尔的叙述相矛盾,只要人们按数学家的方式从字面上读他的叙述即可。至此,我的答案部分与迈克尔的答案有关。


这是彼得的回答引起的想法。在讨论原始问题时,我在一条评论中推测,听起来不同的p值的两个特定分布实际上是相同的。我现在可以证明这一点。更重要的是,该证明揭示了p值的基本性质,如此基本,以至于没有文字(我遇到过)困扰着解释。也许所有的专业统计学家都知道这个秘密,但是对我来说,p值的定义总是显得奇怪而虚假。在透露统计学家的秘密之前,让我先指出一个问题。

ñ>1个ñ2ñ-1个ñ-1个自由程度。这两个分布是不同的,那么p值的关联分布到底如何呢?经过深思熟虑后,我才意识到这种明显的驳斥我的想法太容易了。

F00[01个]

p=ŤFsds
F-[0

[01个]

ñ-1个[01个]2ñ-1个[01个][01个]


我认为p值没有任何神秘秘诀。有些人很难过。这是观察到的值比零假设为TRUE时实际观察到的极端或更极端的概率。我认为您在其中一个公式中拥有这项权利。我确实认为您说过p值是均匀分布的。是的,当零假设成立时,我同意这一点。请记住,使用t检验,原假设可能不成立。那么p值是不均匀的。应该集中近于0
迈克尔·Chernick

其次,我们谈论的是两种不同的测试统计数据。一种是基于配对的,一种不是基于配对的。无论我是否在答案中提到它,未配对t检验的中心t分布的自由度均为2n-2,而配对t检验的对应t分布的自由度为n-1。因此,自由度数较大的一个比另一个自由度更接近标准正态分布。当您将这些测试应用于真实数据时,这有关系吗?没有!当n相当大时不行。
Michael R. Chernick

附带说明一下,成对测试的局限性是要求所有数据都可以成对时应具有相等的样本大小。但是,不成对的测试适用于不相等的样本量。因此,通常,未配对的测试具有n + m-2个自由度。
Michael R. Chernick

您的回答冗长而抽象,我试图通过它进行尝试,但我不理解反例。我只是看不到您将零假设和真实数据考虑在内。观察到的p值是给定数据的测试统计量的适当t分布的积分。您可以比较两个t分布和相同公共数据集的那些数字。如果您以观察到的数据为条件,那么这些均匀分布将不起作用。抱歉,我没有看到您的回答确实回答了您的问题。
Michael R. Chernick

迈克尔:专心于我给的R代码。只需一秒钟即可运行。零假设是X和Y来自相同的正态分布,在我的情况下,这当然是错误的。在我的示例中,Cov(X,Y)> 0,但是未配对的测试比配对的测试具有更大的意义。
大卫·爱泼斯坦

1

我将提供另一种观点。通常,配对可以减少偏差。假设您对暴露E是否是连续结果Y的危险因素感兴趣。对于每个E +主题,您都会获得与年龄和性别相匹配的主题E-。现在,我们可以进行配对t检验或非配对t检验。我认为我们应该明确说明匹配并进行配对t检验。它的原则是将设计考虑在内。在分析中是否考虑匹配是偏差方差折衷的问题。分析中的匹配核算可提供更多保护,以防止偏差,但会增加差异。进行不成对的t检验可能会更有效,但不会提供任何针对偏倚的保护。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.