线性回归中t检验和方差分析之间的差异


12

我想知道线性回归中t检验和ANOVA之间有什么区别?

  1. 是t检验来检验任何一个斜率和截距是否均值为零,而方差分析是用来检验所有斜率是否均均值为零吗?这是它们之间的唯一区别吗?
  2. 在简单的线性回归中,即只有一个预测变量的情况下,只有一个斜率可以估计。那么,t检验和ANOVA是否等效?如果是的话,假设它们使用不同的统计量(t检验使用t统计量,而ANOVA则使用F统计量),怎么做?

广告1)在线性回归中,我通常将ANOVA理解为模型拟合优度的一种度量,即确定模型(回归线)是否解释了总变异性的重要部分。这个问题是否等于所有斜率都为零,这个问题确实很有趣。广告2)在这种情况下,我在t检验和回归方差分析中获得的p值几乎相同。真有趣的定理!
好奇,

Answers:


18

通用线性模型使我们可以将ANOVA模型编写为回归模型。假设我们有两组,每个组都有两个观测值,即向量中有四个观测值。然后,原始的,overparametrized模型是È Ý = X β ,其中X 是预测值的矩阵,即,虚设编码表示变量: μ 1 μ 1 μ 2 μ 2 = 1 1 0 1 1 0 1 0 1 1 0 1yE(y)=XβX

(μ1μ1μ2μ2)=(110110101101)(β0β1β2)

的参数不能被识别为因为X 具有秩2( X ' X 不可逆)。要改变这种状况,我们引入约束β 1 = 0(治疗对比),这为我们提供了新的模式Ë Ÿ = X β((X)X)1(X)E(y)X(X)Xβ1=0E(y)=Xβ

(μ1μ1μ2μ2)=(10101111)(β0β2)

μ1=β0β0μ2=β0+β2β2μ2μ1

tψ=cjβjψ0c=(0,1)β2=0μ2μ1=0ψ^=cjβ^jβ^=(XX)1Xyψ

t=ψ^ψ0σ^c(XX)1c

σ^2=e2/(nRank(X))e2Rank(X)=2(XX)1X=(.5.500.5.5.5.5)β^0=0.5y1+0.5y2=M1β^2=0.5y10.5y2+0.5y3+0.5y4=M2M1c(XX)1c

t=M2M10σ^=M2M1e2/(n2)

ttnRank(X)n2t(M2M1)2/1e2/(n2)=SSb/dfbSSw/dfw=FFbwFnRank(X)

βj1jψ


3

在1中,ANOVA通常将测试因子变量以及组间方差是否显着。如果您的软件在回归中允许指标变量,您将清楚地看到差异:对于每个虚拟对象,您将获得ap值,该值表明该组的得分是否显着不同于0,因此与适用的参考组或参考值显着不同。 。通常,在进行ANOVA测试之前,您不会看到指标本身在多大程度上重要。

F检验是平方t检验。因此,在2中相同。


谢谢!(1)指标变量在这里意味着什么?(2)通常,只有在只有两个组的情况下,t检验才等效于方差分析。但是在简单的线性回归中,可能会有两个以上的组,其中组的数量是预测变量在数据集中采用的值的数量。
蒂姆(Tim)

(1)指标或类别或因素变量...完全相同。(2)确实,但是您可能想知道ANOVA的一组假人/类别的得分。
劳工

谢谢!(2)因此,在简单线性回归中,假设存在两个以上的组,t检验如何等效于方差分析?“一组来自ANOVA的假人/类别得分的表现如何”是什么意思,为什么我想知道呢?
蒂姆(Tim)

在OLS回归中,无论您定义多少组,R²(解释方差)都将等于eta²或ANOVA的MSS / TSS。接下来,您可能想知道一组虚拟变量(即一个指标变量)的作用,以说明该变量组本身是否相关以及在何种程度上相关,这与单个类别与参考类别之间差异的重要性不同。
劳工
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.