Answers:
我想说的是,“回归模型”是一种元概念,因为您将找不到“回归模型”的定义,而是更具体的概念,例如“线性回归”,“非线性回归”, “稳健的回归”等等。这与数学中的方法相同,我们通常不定义“数字”,而是定义“自然数”,“整数”,“实数”,“ p-adic数”等等,如果有人希望包括数字中的四元数就这样吧!其实并不重要,重要的是您当前正在阅读的书/纸使用的定义是什么。
定义是工具,本质主义在讨论…… 的本质,一个词的真正含义,却很少值得。
那么,“回归模型”与其他统计模型又有什么区别呢?通常,存在一个响应变量,您希望将其建模为受一组预测变量影响(或确定)的变量。我们对影响另一个方向不感兴趣,并且对预测变量之间的关系也没有兴趣。通常,我们采用给定的预测变量,并将其视为模型中的常量,而不是随机变量。
上面提到的关系可以是线性或非线性的,以参数或非参数的方式指定,依此类推。
为了与其他模型区分开,当我们接受预测变量中的测量误差的可能性时,我们最好看看通常用来表示“回归模型”不同的其他词语,例如“变量误差”。这很可能包含在我上面对“回归模型”的描述中,但通常被视为替代模型。
此外,各个字段的含义可能有所不同,请参阅对回归变量进行条件处理与将其视为固定条件有什么区别?
重复一遍:重要的是您现在正在阅读的作者所使用的定义,而不是一些关于它“真正是”的形而上学。
已经给出了两个不错的答案,但是我想加两分钱。
在回归的情况下,我们有一些随机变量和。变量具有未知的分布和复杂的协方差结构。我们将这个问题简化为仅关注条件分布,或者更精确地关注给定其他变量的条件期望。我们将其简化为X 1,… ,X k Y
其中是预测变量的函数,根据特定的回归模型可以采用不同的形式(线性,非线性),而是根据广义线性模型考虑回归模型时某种分布的平均值。在GLM的可以是泊松,二项式,伽玛等分布的位置。对于正则化回归,它是Laplace分布的位置,为使Huber损失最小的鲁棒模型,使用了所谓的Huber密度。在四分位数回归的情况下,我们关注分布的其他特征,我们估计是分布的四分位数而不是期望值。μ μ 大号1 μ
因此,我们着眼于条件分布,而不是关注完全联合分布。这种简化是回归模型的关键特征。
基于文献的一些想法:
F. Hayashi在他的经典研究生课本“ Econometrics”(2000年)的第1章中指出,以下假设构成了经典线性回归模型:
Wooldridge在他的经典计量经济学教材《计量经济学:一种现代方法》(2012年)的第2章中指出,以下等式定义了简单的线性回归模型:
格林在其流行的计量经济学教科书“计量经济学分析”(2011)的第2章中指出
经典的线性回归模型由一组有关基本“数据生成过程”如何生成数据集的假设组成。
随后给出了与林氏相似的假设清单。
关于OP对GARCH模型的兴趣,Bollerslev “广义自回归条件异方差”(1986)在第5部分的标题以及该部分的第一句中包括短语“ GARCH回归模型”。因此,GARCH模型之父不介意将GARCH称为回归模型。