我是否在lmer中正确指定了我的模型?


26

我搜寻了很多帮助站点,但仍然对如何在混合模型中指定更复杂的嵌套术语感到困惑。我也困惑,使用:/|在指定的交互,并使用随机因素嵌套lmer()lme4包中R

出于这个问题的目的,我们假设我已使用以下标准统计模型准确地描绘了我的数据: 是固定的,并且是随机的。 (隐式)嵌套在中。

ÿ一世Ĵķ=ü+一世+Ĵ一世+ķ+×一世ķ+×Ĵ一世ķ
stationtowdayTowstation

换句话说,我希望我的模型包括Station(i,fixed),Tow(j,random,隐式嵌套在Station中),Day(k,random),以及Tow和Day之间的交互以及Day之间的交互和车站。我已经咨询了统计学家以创建我的模型,并且目前认为它可以代表我的数据,但同时也会在我的文章底部添加对我的数据的描述,以免造成混乱。

到目前为止,我能够拼凑的内容如下lmer

lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day), 
     data=my.data)

这是否准确地描绘了我的统计模型?如果无法正确阅读我的代码,有什么建议吗?

我已经加粗了我在lmer公式中难以指定的特定术语

#1 当拖曳是随机的且站是固定的时,在站内嵌套的拖曳
我很困惑,但是关于使用:和区分随机的嵌套和交互项/。在上面的示例中,我(1|station:tow)希望读取嵌套在站内的丝束。我在各个网站上都读到了相互矛盾的评论,无论我是应该使用:还是使用/随机(1|...)格式lmer

#2。当站是固定站和天之间的相互作用和日是随机的
话,我有(1|station:day),但这次我希望它会读取站和天之间的相互作用。似乎我可以使用station * day来解释Station和Day的个体影响以及它们之间的相互作用(而不是像我上面那样单独包括三个术语中的每一个),但是我看不到如何指定它当一个是固定的而另一个是随机的时 会station*(1|day)那样做吗?

#3。拖曳嵌套在站点中时,拖曳与日之间的交互(都是随机的)(固定) 然后,我(1|tow:day)希望读取与tow和的交互day,但是我想知道是否需要再次指定拖曳嵌套(隐式)在车站?

我是新来的都Rlmer和统计建模和高度赞赏全面的讲解,在任何反应的麻烦我的问题,如果可能的。

有关我的数据的更多详细信息:我问的是,近岸海洋中各个物理前沿的浮游生物浓度是否有所不同。我在这条战线的近海,近海和近海有3个站。站因此被固定。在每个站,我要取三个复制的浮游生物丝束(从中进行分类,计数和集中,以每立方米水的虫子数量表示浓度)。拖曳是随机的:在三个拖曳中,我希望解释该特定站浮游生物的一般变化。拖车本质上嵌套在工作站中,因为每个拖车没有唯一的ID(123,123,123是每个工作站上的拖车的ID)。然后,我在已经形成的新战线的多个独立日子里完成了此任务。我想我可以将Day视为阻碍因素吗?日是随机的,因为在多个独立的前台日重复此操作正试图捕获每天的变化并代表存在该前台的所有日。我想了解交互作用术语,以查看拖曳是否每天都在变化,并且站点是否总是产生相似的数据,还是取决于一天?

再次感谢您的时间和帮助,非常感谢!


我确实相信您在标准统计模型上缺少一些下标(如果我误解了,我不想添加它们)。

1
FWIW,对于那些遇到此线程并想知道它是否是主题的人,考虑到它专注于R语法,IMO,它具有足够的统计性(无法理解所指定的模型如何与嵌套和交互等相关)用于简历。
gung-恢复莫妮卡

1
我认为这是100%的话题。

8
这些线程可能会有所帮助:1 R的lmer备忘单2 解释“混合模型”的三种形式3个 关于如何在mer中指定随机效应的问题 ; 关于在R中指定线性混合模型以用于具有附加嵌套结构的重复测量数据的4个 问题。(尽管如此,我认为这是足够明显的,所以它不是重复的。)
gung-恢复莫妮卡

2
根据您的lmer()语法,您指定了一个模型,该模型具有station和的固定影响,四个随机截距由具有(1)station和和tow(2)值Day,(3)stationday和( 4)tow和的组合day。这是您想要的吗?我不确定,因为正如@BabekP所指出的那样,您如何编写模型公式尚不清楚。您编写的是变量名,而不是参数。通常,在这样的模型中,变量组合由下标捕获。
2013年

Answers:


23

当拖曳是随机的并且站是固定的时,拖被嵌套在站内

station+(1|station:tow)是正确的。就像@John在他的回答中所说的那样,(1|station/tow)它将扩展到(1|station)+(1|station:tow)(站的主要效果以及拖曳和站之间的交互作用),这是您不想要的,因为您已经将站指定为固定效果。

当站点固定且日期是随机的时,站点与日期之间的交互。

固定效应和随机效应之间的相互作用始终是随机的。再次如@John所说,station*day扩展到station+day+station:day,您(同样)不需要,因为您已经day在模型中指定 了。我不认为有一种方法可以做您想要的事情并折叠day(random)和station(fixed)的交叉效果,但是如果您想编写station+(1|day/station),可以这样做,如上一个答案中所指定的,它将扩展为station + (1|day) + (1|day:station)

丝束与丝束嵌套在工作站中的日期之间的交互作用

因为你不具备的独特价值tow变量(即,因为像你说的下面拖指定123在每个车站,你需要指定嵌套,因为(1|station:tow:day)如果你确实有丝束指定的唯一,你可以使用任何(1|tow:day)(1|station:tow:day)(它们应该给出等效的答案)。如果在这种情况下指定嵌套,lme4将尝试估计由#1拖曳在所有工作站上共享的随机效果...

station:tow:day××

http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#model-specificationhttp://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#nested-or-crossed有用吗?


非常感谢您的有用答复和参考,非常感谢。我对您在上面描述的表示法(1 | a:b)感到困惑,其中的':'可能表示“嵌套在”以及交互作用。如何同时指定两者?换句话说,lmer如何知道您所指示的关系?抱歉,我这里一定缺少基本的东西。
wtree

4
在这种情况下,交互和嵌套之间并没有太大区别。无论B是嵌套在A或只是相互作用与它取决于是否主要作用A是包含在模型或没有。如果主要作用B同样的模型,然后它越过...
奔Bolker

大家好,我在这里问了一个相关的问题:stats.stackexchange.com/questions/272377/…是否有人(特别是@BenBolker)有机会看一下并提供答案。
Joshua Rosenberg

11

公式中的某些内容有些令人困惑。的:是两个词之间的相互作用,而*对主要影响和相互作用。它/是用于交互的另一个,但它的作用是在分子与分母中所有项(例如A/(B+C) = A:B + A:C)之间生成交互。该|是类似“分组依据”。因此,1|station将按站分组并在括号中被随机截取(1|station)。这样便可以嵌套。

希望有帮助。将随机效果嵌套在固定效果中有点奇怪,我不确定您将如何表示。我什至无法想象这种情况。如果仅解释变量是什么以及要完成什么,则可能会得到更好的响应。很多时候人们问问题并且使用错误的术语,很难沟通。解释变量代表什么以及您想了解什么。

着眼于您在最后一段中的描述,听起来您的拖曳只是表明您收集的样本,而不是您需要估算的东西,因为您希望拖曳1与拖曳2始终保持某种不同。拖曳仅表示样品。除非您真的相信丝束的顺序很重要,否则您甚至都不必理会该变量。如果它们很重要,那么它是固定的效果(可能是随机的,但不是唯一的随机效果)。您说您想知道丝束是否每天都在变化。答案是肯定的吗?它们并非每天都在变化,这并不是在现实的可能性范围内。这只是您的测量方法的差异。您' 不允许尝试考虑所有差异规范,因为这样一来您最终就不会留下任何差异以弥补错误。您将拥有一个过度指定的模型。您只需要报告每个度量即可。

您想知道车站是否每天变化,您也做出类似的陈述。当然可以。但是也许您指的是特定的日子?是否按季节,月球周期等将天分组?除非您在第1天(今天是第2天)之外有其他东西,否则知道站点每天都在变化,那么如何知道站点以外的其他信息又如何变化呢?因此,该问题的答案当然是车站每天都在变化。当然,丝束每天变化,站与站之间也不同。您最终得到一个简单的模型:

aov(y ~ station, data = dat)

您在这里拥有的一个固定效果就是驻车,它是在多个拖曳和多天的时间内采样的。我不确定您是否真的需要多级建模。听起来好像您过度指定了模型。

如果您确实希望获得随机的日间拖曳效果,并且此处未指定信息,则可以将其扩展为多层次模型。那将是:

lmer(y ~ station + (two*day|station), data = dat)

但是,您每个工作日和每个工作日都需要多个拖缆才能使用该模型。


我同意您所说的一切,但我认为这可能更多是评论而不是答案。
2013年

@John我一直和你在一起,直到“那是你做嵌套的方式”。我想我错过了如何进行嵌套的实际要点。您愿意详细解释吗?我认为我仍然对| |感到困惑。并将对其进行更多研究。但是从您的答复来看,我仍然不确定如何例如指示拖曳(随机)嵌套在工作站(固定)内?
wtree

@John Oh,站固定为海洋中感兴趣的站点/位置,并且拖曳是随机的,因为我在这些站点上采用浮游生物拖曳,这些站点是随机的,因为它们试图解释每个站点的浮游生物的变异性,然后进行推断代表一个站的浮游生物种群。
wtree

1
并非样本的每个标签都是随机变量,请参见编辑。
John

1
鉴于上述说明,我仍然认为丝毫不应该在模型中。那天听起来不错。
John
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.