多元回归中解释变量的系数告诉我们该解释变量与因变量的关系。所有这些,同时“控制”其他解释变量。
到目前为止,我的看法:
在计算每个系数时,未考虑其他变量,因此我认为它们被忽略。
当我认为“受控”和“被忽略”这两个术语可以互换使用时,我说的对吗?
多元回归中解释变量的系数告诉我们该解释变量与因变量的关系。所有这些,同时“控制”其他解释变量。
到目前为止,我的看法:
在计算每个系数时,未考虑其他变量,因此我认为它们被忽略。
当我认为“受控”和“被忽略”这两个术语可以互换使用时,我说的对吗?
Answers:
控制某件事和忽略某件事不是一回事。让我们考虑一个只有3个变量存在的Universe:,和。我们想要建立一个预测的回归模型,并且我们特别希望它与关系。有两种基本的可能性。
我们可以评估之间的关系和而忽略:
当然,这些是非常简单的模型,但是它们构成了查看和之间的关系如何体现的不同方式。通常,在两个模型中,估计的可能相似,但它们可能完全不同。在确定它们有多大不同时,最重要的是和之间的关系(或不存在它们之间的关系)。考虑一下这个数字:
在这种情况下,与相关。由于该图是二维的,因此它会忽略(也许具有讽刺意味),因此我用不同的符号和颜色表示了每个点的值(下面的伪3D图提供了另一种尝试显示结构的方法数据)。如果我们拟合忽略的回归模型,则会得到黑色实线。如果我们符合这个模型控制为,我们会得到一个回归平面,这又是很难的情节,所以我通过平面绘制三片,其中,,且X 2 X 2 X 2 X 2 X 2 X 2 = 1 X 2 = 2 X 2 = 3 X 1 Y X 2 X 2 。因此,我们有表现之间的关系线和当我们持有控制为。值得注意的是,我们看到控制不会产生单行,而是产生一组行。
考虑忽略和控制另一个变量之间区别的另一种方法是考虑边际分布和条件分布之间的区别。考虑一下这个数字:
(这是从我在这里的答案中得出的:条件高斯分布背后的直觉是什么?)
如果查看绘制在主图左侧的正态曲线,则为的边际分布。如果我们忽略与关系,它就是的分布。在主图中,有两条法线曲线表示和时条件分布。条件分布控制的级别,而边际分布忽略它。 Y X Y X 1 = 25 X 1 = 45 X 1
它们不会被忽略。如果它们被“忽略”,它们将不会出现在模型中。感兴趣的解释变量的估计是有条件的其他变量。估计是在模型中“在”其他变量的上下文中或“允许”其他变量的影响下形成的。