我正在尝试扩展我的统计知识。我来自物理科学背景,采用“基于配方”的方法进行统计测试,我们说它是连续的,是否呈正态分布-OLS回归。
在阅读中,我遇到了以下术语:随机效应模型,固定效应模型,边际模型。我的问题是:
- 简单来说,它们是什么?
- 它们之间有什么区别?
- 他们有同义词吗?
- 传统测试(例如OLS回归,ANOVA和ANCOVA)在哪里分类?
只是尝试决定自学的下一步。
我正在尝试扩展我的统计知识。我来自物理科学背景,采用“基于配方”的方法进行统计测试,我们说它是连续的,是否呈正态分布-OLS回归。
在阅读中,我遇到了以下术语:随机效应模型,固定效应模型,边际模型。我的问题是:
只是尝试决定自学的下一步。
Answers:
该问题已在本站点进行了部分讨论,如下所示,并且意见不一。
所有术语通常与纵向/面板/聚类/分层数据和重复度量(以高级回归和ANOVA的格式)相关,但在不同上下文中具有多种含义。我想根据我的知识用公式回答这个问题。
通常将边际模型与条件模型(随机效应模型)进行比较,前者侧重于总体均值(以线性模型为例)而后者处理条件均值对于非线性模型(例如逻辑回归),边际模型与随机效应模型之间的回归系数的解释和尺度将有所不同。令,然后
如果我在这里错了,请纠正我:
从概念上讲,有四种可能的影响:固定截距,固定系数,随机截距,随机系数。大多数回归模型是“随机效应”,因此它们具有随机截距和随机系数。与“固定效应”相反,使用了“随机效应”一词。
“固定效应”是指变量影响某些样本,而不是全部样本的情况。固定效果模型的最简单版本(从概念上来说)将是虚拟变量,用于具有二进制值的固定效果。这些模型具有单个随机截距,固定效应系数和随机变量系数。
从概念上讲,下一阶段的并发症是固定效应不是二进制的,而是名义上的,具有很多值。在这种情况下,生成的模型具有很多截距(每个标称值一个)。这是获得面板数据模型的经典“多行”的地方,固定效果变量的每个“选项”都具有自己的效果。将所有不同因数专用数据序列放入一个回归中(而不是将固定效应的每个因数作为其自身的回归)的好处是,您可以将所有不同效应的方差集中在一个方程式中,如此获得所有系数的更好(更确定)值。
复杂性的“第三层”是“固定效应”本身是一个随机变量时,除了其“固定效应”仅影响样本的一个子集外。此时,模型将具有随机截距,多个固定截距和多个随机变量。我认为这就是所谓的“混合效应”模型?
“混合效应”模型用于多层次建模(MLM),因为“固定效应”可用于将一个数据子集嵌套在另一个子集中。该分组可以具有多个层次,其中学生嵌套在教室内,嵌套在学校内。学校对教室和学生的教室都有固定的影响。(学校可能会对学生产生固定影响,具体取决于实验设计-不确定)
面板数据模型是“混合效果”模型,但是使用两个维度进行分组,通常是时间和某种类别。