Answers:
我会很快说:“多个”适用于以单个结果(Y响应)进入模型(或等效设计矩阵)的预测变量的数量,而“多变量”是指响应向量的矩阵。记不清从这个考虑开始多变量建模入门部分的作者,但我认为正是Brian Everitt在他的教科书《 R和S-Plus多变量分析指南》中。要对此进行详尽的讨论,我建议看一下他的最新著作《行为科学的多变量建模和多变量分析》。
对于“变量”,我想说这是引用遵循已知或假设分布的任何随机变量的一种常用方法,例如,我们说高斯变量是从正态分布中得出的一系列观测值(参数和)。用概率术语,我们说这些是X的一些随机实现,数学上的期望为,其中约95%的期望范围在。
这是两个紧密相关的示例,它们说明了这些想法。这些例子在某种程度上是以美国为中心的,但是这些思想可以推论到其他国家。
例子1
假设一所大学希望完善其录取标准,以便他们录取“更好”的学生。另外,假设大学希望将学生的平均绩点(GPA)用作学生的绩效指标。他们考虑了几个标准,例如高中GPA(HSGPA),SAT成绩(SAT),性别等,并且想知道就GPA而言,这些标准中的哪个重要。
解决方案:多元回归
在上述情况下,有一个因变量(GPA),而您有多个自变量(HSGPA,SAT,性别等)。您想找出哪个自变量是因变量的良好预测变量。您将使用多元回归进行评估。
例子2
代替上述情况,假设招生办公室想要跟踪学生在整个时间的表现,并希望确定他们的哪个标准推动了学生在整个时间的表现。换句话说,他们拥有学生在校四年的GPA得分(例如,GPA1,GPA2,GPA3,GPA4),并且他们想知道哪个自变量可以预测GPA得分逐年提高以年为基础。招生办公室希望找到相同的自变量来预测四年内的表现,以便他们选择的招生标准确保学生在过去四年中始终保持较高的表现。
解决方案:多元回归
在示例2中,我们有多个因变量(即GPA1,GPA2,GPA3,GPA4)和多个自变量。在这种情况下,您将使用多元回归。
简单回归涉及一个因变量()和一个自变量():
多元回归(aka多元回归)涉及一个因变量和多个自变量:
多元回归适用于多个因变量和多个自变量:。您可能会遇到因变量和自变量都按变量矩阵排列的问题(例如和),因此表达式可以写为,其中大写字母表示矩阵。ý 11,ÿ 12,。。。X 11,X 12,。。。Y = f (X )
进一步阅读:
我认为除了方程两边的变量数量之外,这里的关键见解(和微分)是对于多元回归的情况,目标是利用以下事实:响应变量之间(通常)存在相关性(或结果)。例如,在医学试验中,预测因素可能是体重,年龄和种族,而结果变量是血压和胆固醇。从理论上讲,我们可以创建两个“多元回归”模型,一个可以使体重,年龄和种族的血压回归,而另一个可以使胆固醇在相同因素上回归的模型。然而,另外,我们可以建立一个单一的多元回归模型,预测两血压和胆固醇同时基于三个预测变量。想法是,多元回归模型可能更好(更具预测性),可以从患者的血压与胆固醇之间的相关关系中学习更多。
在多元回归中,有一个以上具有不同方差(或分布)的因变量。预测变量可以大于一个或多个。因此,可能是具有因变量矩阵(即多个方差)的多元回归。但是,当我们说多元回归时,我们的意思是只有一个具有单一分布或方差的因变量。预测变量不止一个。总结多个变量是指多个预测变量,而多元变量是多个因变量。