Answers:
在线性回归中,假设和不是随机变量。因此,模型
在代数上与
在这里,和。错误项不受影响。拟合该模型,将系数分别估计为和,并以通常的方式检验假设。
问题末尾写的统计数字尽管与形式正式相似,但不是卡方统计。卡方统计量涉及计数而不是数据值,并且必须在其分母中具有期望值,而不是协变量。一个或多个分母可能为零(或接近零),表明此公式存在严重错误。如果这还不能令人信服,请考虑,和的度量单位可以是任何单位(例如drams,parsecs和pecks),这样这样的线性组合(通常)毫无意义。它没有测试任何东西。
您可以使用完全模型测试或简化模型测试来检验该假设。这是您的操作方式。首先,拟合模型并从该模型中获得残差。将残差平方并求和。这是整个模型的平方误差总和。叫这个。接下来,计算 哪里 。这些是您在原假设下的残差。将它们平方并加总。这是简化模型的平方误差总和。叫这个。
现在计算:
F = ,
哪里 是样本量。下,则此F统计量遵循具有 和 自由程度。
这是使用R的示例:
x <- rnorm(n)
y <- rnorm(n)
z <- 1/2*x + 1/2*y + rnorm(n) ### note I am simulating under H0 here
res <- lm(z ~ x + y - 1)
summary(res)
SSE.f <- sum(resid(res)^2)
zhat <- 1/2*x + 1/2*y
SSE.r <- sum((z-zhat)^2)
F <- ((SSE.r - SSE.f) / 2) / (SSE.f / (n-2))
pf(F, 2, n-2, lower.tail=FALSE) ### this is the p-value
如果p值低于.05(如果您的 确实是.05)。
我假设您确实要让模型不包含拦截。换句话说,我假设您确实正在使用该模型 并不是 。