我发现简单的数据分析练习通常可以帮助说明和阐明统计概念。您使用哪些数据分析练习来教授统计概念?
我发现简单的数据分析练习通常可以帮助说明和阐明统计概念。您使用哪些数据分析练习来教授统计概念?
Answers:
多元回归系数与预期符号谬误
我通过数据分析练习对统计概念的最喜欢的插图之一是将多元回归解构为多元双变量回归。
目标
概念
多元回归模型中的回归系数表示a)给定预测变量(x1)与模型中所有其他预测变量(x2 ... xN)不相关的部分之间的关系;2)响应变量(Y)与模型中所有其他预测变量(x2 ... xN)不相关的部分。当预测变量之间存在相关性时,与预测变量系数相关的符号表示这些残差之间的关系。
行使
r2的第4步的系数将是x1和x2的多元回归模型的x1系数。您可以通过为y和x2分配x1来对x2做同样的事情。
这是此练习的一些R代码。
set.seed(3338)
x1 <- rnorm(100)
x2 <- rnorm(100)
y <- 0 + 2*x1 + 5*x2 + rnorm(100)
lm(y ~ x1 + x2) # Multiple regression Model
ry1 <- residuals( lm( y ~ x2) ) # The part of y not related to x2
rx1 <- residuals( lm(x1 ~ x2) ) # The part of x1 not related to x2
lm( ry1 ~ rx1)
ry2 <- residuals( lm( y ~ x1) ) # The part of y not related to x1
rx2 <- residuals( lm(x2 ~ x1) ) # The part of x2 not related to x1
lm( ry2 ~ rx2)
以下是相关的输出和结果。
Call:
lm(formula = y ~ x1 + x2)
Coefficients:
(Intercept) ***x1*** ***x2***
-0.02410 ***1.89527*** ***5.07549***
Call:
lm(formula = ry1 ~ rx1)
Coefficients:
(Intercept) ***rx1***
-2.854e-17 ***1.895e+00***
Call:
lm(formula = ry2 ~ rx2)
Coefficients:
(Intercept) ***rx2***
3.406e-17 ***5.075e+00***