MANOVA的原假设是什么?


11

背景

为了分析不同组之间某个连续变量之间的差异(由类别变量给出),可以执行单向方差分析。如果存在多个解释性(分类)变量,则可以执行阶乘方差分析。如果要分析几个连续变量(即几个响应变量)之间的差异,则必须执行多元ANOVA(MANOVA)。

我几乎不了解如何对多个响应变量执行类似于ANOVA的测试,更重要的是,我不了解原假设是什么。是原假设:

  • “对于每个响应变量,所有组的均值均相等”,

还是

  • “对于至少一个响应变量,所有组的均值相等”,

还是还有其他东西?H0


我不知道,您是否也在询问方差分析的工作原理?在讨论什么是标准误差的情况下,我从本质上解释了方差分析的基本概念:标准误差如何工作?
gung-恢复莫妮卡

您的两个陈述都没有。H0MANOVA的观点是多元空间没有差异。多变量的情况比单变量要复杂得多,因为我们必须处理协方差,而不仅仅是方差。存在多种方法来表达H0-H1MANOVA中的假设。阅读维基百科。
ttnphns

@ttnphns:为什么都不?ANOVA 的是所有组的均值相等。MANOVA 的H 0是所有组的多元均值相等。这恰好是OP中的替代方案1。协方差等输入MANOVA 的假设计算,而不是原假设。H0H0
变形虫说莫妮卡

@amoeba,我不喜欢For each response variable。对我来说,这听起来像(或者我读为)“在每个测试上都进行了单一测试”(然后以某种方式进行了组合)。
ttnphns

Answers:


9

零假设单向ANOVA的是,所有组的平均值是相等的:ħ 0μ 1 = μ 2 = = μ ķ单向MANOVA 的零假设H 0是所有组的[多元]均值相等:这相当于说每个响应变量的均值相等,即您的第一个选择是正确的H0

H0:μ1=μ2=...=μk.
H0
H0:μ1=μ2=...=μk.

在这两种情况下,替代假设为零的否定。在这两种情况下,假设都是(a)组内高斯分布,以及(b)组之间相等的方差(对于ANOVA)/协方差矩阵(对于MANOVA)。H1

MANOVA和ANOVA之间的区别

这可能看起来有些令人困惑:MANOVA 的零假设与单变量ANOVA集合的零假设的组合完全相同,但是同时我们知道,进行MANOVA并不等同于进行单变量ANOVA,因此“合并”结果(可以提出多种合并方法)。为什么不?

答案是,即使将测试相同的原假设,运行所有单变量方差分析都将具有较小的功效。请查看我的回答以获取说明:当单变量方差分析均未达到显着水平时,MANOVA如何报告显着差异?天真的“组合”方法(如果至少一个ANOVA拒绝零值,则拒绝全局零值)也将导致I型错误率的大幅膨胀。但是,即使人们选择了一种巧妙的“组合”方式来维持正确的错误率,也会失去动力。

测试如何进行

ANOVA分解求和的平方的总到求和的平方组间及和的平方组内,使得。然后,它计算比率。在原假设下,该比率应很小(约为);可以计算出在零假设下该比率的确切分布(它将取决于和组数)。将观测值与该分布进行比较,得出p值。B W T = B + W B / W 1 n B / WTBWT=B+WB/W1nB/W

MANOVA分解的总散射矩阵成组之间散布矩阵和组内散布矩阵,使得。然后,它计算矩阵。在零假设下,该矩阵应为“小”(在);但是如何量化它有多“小”呢?MANOVA查看该矩阵的特征值(它们都是正数)。再次,在原假设下,这些特征值应为“小”(均约为W¯¯ Ť = + w ^ w ^ - 1λ 1 Σ λ 最大{ λ }TBWT=B+WW1BIλi1)。但是要计算p值,我们需要一个数字(称为“统计”),以便能够将其与null下的预期分布进行比较。有几种方法可以做到:将所有特征值的总和 ; 取最大特征值等。在每种情况下,都将该数字与预期的空值下该数量的分布进行比较,得出p值。λimax{λi}

检验统计量的不同选择会导致p值略有不同,但重要的是要意识到,在每种情况下都将检验相同的原假设。


另外,如果您不对多次测试进行校正,则全单变量ANOVA方法也会产生I型错误膨胀。
gung-恢复莫妮卡

1
@gung:是的,也是这样。但是,只要至少一个ANOVA拒绝零值,就可以比仅仅拒绝零值更聪明。我的观点是,无论多么聪明的人尝试“组合”,与MANOVA相比,它仍然会失去能力(即使有人设法保持测试的大小而又不增加错误率)。
变形虫说莫妮卡(

但是,现在这种“能力”不是与协方差的概念直接相关吗?道德是,通过(一系列)单变量检验,我们仅测试了SSdifference/SSerror标量的边际效应。在MANOVA中,多元效应是SSCPerror^(-1)SSCPdifference矩阵(占总方差和组内协方差)。但是,由于其中有多个特征值可能无法在检验统计量中以单一方式“组合”,因此存在几种可能的替代假设。更大的能力-理论上更复杂。
ttnphns

@ttnphns,是的,这都是正确的,但是我认为这不会改变零假设就是我所写的事实(这就是问题所在)。无论使用什么检验统计量(Wilks / Roy / Pillai-Bartlett / Lawley-Hotelling),他们都试图检验相同的原假设。我可能会在以后扩展我的答案以更详细地讨论这一点。
变形虫说莫妮卡(

1
@gung要求我插话(不知道为什么。大约7年前我教过MANOVA,但从未应用过)-我说变形虫说是对空的完全否定是正确的,它是参数维空间中的维超空间(如果是迄今为止没有人打扰定义的维) 。这是OP给出的选项1。选项2更加难以测试。H 0μ 组  1 = = μ 组  k p k p pH1H0:μgroup 1==μgroup kpkpp
StasK 2015年

8

它是前者。

但是,这样做的方式并不是逐字比较每个原始变量的均值。相反,响应变量以与主成分分析非常相似的方式进行线性转换。(这里的PCA上有一个很好的线程:理解主成分分析,特征向量和特征值。)不同之处在于PCA定向您的轴以使其与最大变化方向对齐,而MANOVA则将轴旋转至最大限度地分离您的团队。

不过要明确的是,与MANOVA相关的测试都没有一个在直接意义上一个接一个地测试所有方法,无论是在原始空间中还是在转换空间中。有几种不同的测试统计数据,每种统计数据的工作方式略有不同,但是它们倾向于对分解空间的分解的特征值进行运算。但是就零假设的本质而言,这是所有组的所有均值在每个响应变量上都是相同的,并不是说它们在某些变量上可以有所不同,但在至少一个变量上是相同的。


哦,好吧,Manova进行了线性判别分析(以最大化各组平均值之间的距离),然后使用第一个轴作为响应变量运行标准方差分析?因此,是“所有组的均值-就PC1而言都是相同的”。那正确吗?Ho
Remi.b,2015年

有几种不同的可能测试。仅测试第一轴实际上是使用Roy的最大根作为测试。这通常是最强大的测试,但它也更加有限。我收集了关于哪个测试是“最佳”的持续讨论。
gung-恢复莫妮卡

我想我们使用MANOVA而不是几个ANOVA来避免多个测试问题。但是,如果仅通过进行MANOVA就可以在LDR的 PC1上进行ANOVA 检验,那么在查看Pvalue时仍然要考虑多个测试问题。这是正确的吗?(希望更有意义。我删除了之前的不清楚的评论)
Remi.b,2015年

这是一个有见地的观点,但是有两个问题:1)轴现在是正交的,并且可以通过多次测试来改变问题;2)MANOVA测试统计数据的采样分布考虑了多个轴。
gung-恢复莫妮卡

1
@ Remi.b:这是个很好的问题,但要清楚一点:MANOVA 等同于LDA的第一个判别轴上的ANOVA!有关MANOVA与LDA之间的关系,请参见此处:MANOVA与LDA有何关系?
变形虫说莫妮卡(
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.