随机效应可以仅应用于分类变量吗?


9

这个问题听起来可能很愚蠢,但是... 随机效应仅适用于分类变量(例如个体ID,人口ID等)是正确的吗,例如说是分类变量:X一世

ÿ一世βX一世

βX一世ñØ[Rμδ2

但是根据原理,随机效应不能应用于连续变量(例如高度,质量...),例如:ž一世

ÿ一世α+βž一世

因为只有一个系数不能约束?听起来合乎逻辑,但我想知道为什么统计文献中从未提及它!谢谢!β

编辑:但是如果我约束像〜?那是随机效应吗?但这与我对施加的约束不同-在这里,我约束变量,而在前面的示例中,我约束了系数!对我来说,它开始看起来像是一团糟。。。不管怎么说,放这个约束没有多大意义,因为是已知值,所以也许这个想法很奇怪:-)ž一世ž一世ñØ[Rμδ2βX一世ž一世


1
有趣的相关问题:stats.stackexchange.com/q/61531/5509
好奇的

Answers:


5

这是一个很好且非常基本的问题。

随机效应的解释是非常特定于领域的,并且取决于建模选择(统计模型还是贝叶斯或常客)。有关非常好的讨论,请参见第245页,Gelman和Hill(2007)。对于贝叶斯算法,所有事物都是随机的(即使参数可能具有真实的固定值,它们也会被建模为随机变量),而常客也可以选择参数值作为固定效果,否则将其建模为随机变量(请参见Casella, 2008年,示例3.2中有关固定或随机块的讨论。

编辑(评论后)

观察数据后,数据将被修复。如果它们是连续的,则应将它们建模为连续的。您可以将分类变量建模为分类变量,有时也可以将其建模为连续变量(例如在有序变量设置中)。参数未知,可以将其建模为固定或随机模型。参数本质上与对预测变量的响应相关。如果希望各个预测变量的斜率(或其线性模型中的系数)随每个响应而变化,则将其建模为随机模型,否则将其建模为固定模型。同样,如果您希望截距因组而异,则应将它们建模为随机模型。否则,应将其修复。


1
谢谢您的回答,但是hmmm ....我提出了一个简单的问题,并期望以某种简单或通用的方式进行回答:)在您的第二段中,您声明在贝叶斯方法中,所有内容都是随机的。请不要过于复杂:)我在模型级别有​​意地询问,请忘记常客或贝叶斯-我对原理感兴趣- 随机影响通常用于哪种类型的变量?
好奇的

在第三段中,您放置了一个带有时间序列的特殊应用程序,我不确定我是否理解它,但是如果您谈到串行相关性,则AFAIK时间序列通常是离散的(不是连续的)...无论如何,如果您有某种更一般的含义回答,请分享。再次感谢您的回答!
好奇的

随机性存在于未知的事物中。当您有观察时,它们就是已知的!您唯一知道的是您的数据。未知数是参数,可以将其建模为随机或固定模型。(很抱歉造成混乱;我同意,我不必要地使事情变得复杂。)
suncoolsu 2011年

感谢您简化答案。因此,这是我的问题的根源-这是否意味着答案是肯定的,即随机效应仅适用于分类变量,因为随机效应仅适用于参数(不适用于数据),并且是唯一可以建模的参数具有多个级别的变量(即类别变量的变量)是随机的吗?而且连续变量的参数不能建模为随机变量,因为连续变量的参数值只有1个?谢谢!
好奇的

在您的特定设置中,答案是。但是总的来说,答案是“ 否”,因为连续变量可以根据组而变化。例如,城市居民的收入应高于村庄(根据您的说法,这可能是位置的两个单独的分类变量)。
suncoolsu 2011年

3

您的问题可能已经解决,但实际上是写在教科书中。

随机效应是类别变量,其水平被视为来自较大人群的样本,与固定效应相反,固定效应的水平本身就是令人感兴趣的,

在第232页上:艾伦·格拉芬(Alan Grafen)和罗西·海尔斯(Rosie Hails)(2002年),“生命科学的现代统计数据”,牛津大学出版社。


2
都是如此,但是我认为这不能回答问题。
帕特里克·库洛姆贝

1
我不同意@PatrickCoulombe的上述评论,我认为这正好回答了这个问题。+1。
变形虫

1

我认为问题在于这里涉及两件事。随机效应的一个典型示例是根据许多因素预测大学生的平均成绩(GPA),包括高中期间一系列测试中的平均成绩。

平均分数是连续的。对于每个人的平均分数,您通常会有不同的截距或截距和斜率。个人显然是绝对的

因此,当您说“仅适用于分类变量”时,这有点含糊。假设您只考虑平均分数的随机截距。在这种情况下,您对连续量的随机截距实际上可能被建模为高斯变量,其均值和标准差将由该过程确定。但是,这种随机截距是在整个学生群体中确定的,其中每个学生都由分类变量标识。

您可以使用“连续”变量而不是学生ID。也许您可以选择学生的身高。但是,基本上必须将其视为是绝对的。如果您的身高测量非常精确,那么您将再次为每个学生获得一个唯一的身高,那么您将获得什么成就。如果您的身高测量值不是很精确,您最终将多个学生聚集在每个身高上。(以可能不明确的方式混合分数)。

这与交互作用相反。在交互中,您将两个变量相乘,并且本质上将两个变量都视为连续变量。将类别变量分解为一组0/1虚拟变量,并且将0或1乘以交互中的其他变量。

最重要的是,“随机效应”在某种意义上只是具有分布(已建模)的系数,而不是固定值。


请以您的主要帐户登录才能进行编辑。
变形虫
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.