具有采样变量的混合效应模型设计


11

我正在尝试lme4为实验设计指定线性混合效果模型(带有)的公式,但是不确定执行是否正确。

设计:基本上,我正在测量植物的响应参数。我有4种治疗水平和2种灌溉水平。将植物分为16个地块,在每个地块中,我对4个子图进行采样。在每个子图中,我进行15到30次观察(取决于发现的植物数量)。即,总共有1500行。

在此处输入图片说明

最初,子图级别只是出于采样目的,但是我想在模型中将其考虑在内(作为64级变量),因为我看到从一个子图到另一个子图有很多可变性,即使在同一图内(大于整个图之间的差异)。

我的第一个想法是写:

library(lme4)
fit <- lmer(y ~ treatment*irrigation + (1|subplot/plot), data=mydata)

要么

fit <- lmer(y ~ treatment*irrigation + (1|subplot) + (1|plot), data=mydata)

那是对的吗?我不确定是否必须在公式中同时保留两个图/子图级别。没有固定的影响是重要的,但随机的影响是非常重要的。

Answers:


9

您的模型应写为

fit <- lmer(y ~ treatment*irrigation + (1|plot/subplot), data=mydata)

因为子图嵌套在站点内。尽管如果子图被唯一标记(即1A,1B,1C,...,2A,2B,2C而不是A,B,C ...,A,B,C),(1|plot) + (1|subplot)将起作用。我的书章节来自Fox等。生态统计描述了一个嵌套的例子:

另一方面,在the的示例中,每个小鸡仅出现在一个育雏中,并且每个育雏仅出现在一个站点中:模型规格(1 | SITE/BROOD/INDEX)为“嵌套在站点内的雏鸡中嵌套的小鸡(INDEX)”,或等效地(1 | SITE) + (1 | SITE:BROOD) + (1 | SITE:BROOD:INDEX)。如果育雏区和育雏区具有唯一标记,则该软件可以检测到嵌套,(1 | SITE) + (1 | BROOD) + (1 | INDEX)也将起作用(请勿使用(1 | SITE) + (1 | SITE/BROOD) + (1 | SITE/BROOD/INDEX);这将导致模型中出现多余的术语)。

其他想法:

  • 有关嵌套和模型规格的更多信息,请访问http://glmm.wikidot.com/faq
  • 您的灌溉处理是否如上图所示组织得井井有条,即无散布?还是只是为了图形显示的方便?如果是前者,那么您的实验设计可能会出现问题...
  • 由于子图嵌套在站点中,因此推断(在Murtaugh 2007 生态学 “生态数据分析中的简单性和复杂性之后”)可以采用图均值并在图级上分析数据。
  • 就其价值而言,我认为您可以走得更远,更进一步达到情节水平。那么您可以完全跳过混合模型,然后执行lm(y~treatment*irrigation, data=my_aggregated_data)

感谢您的帮助(我有12小时等待解锁+50的时间:(的确,我对子图的命名有很大的疑问(4或64个唯一标签)。这个数字是正确的:灌溉不是“随机”的,那是不幸的是,我同意(他们告诉我:“太宽泛地以不同的方式来做!”!)。感谢您的链接。另一个问题:我得到的残差图看起来不太好:圆锥形(像这样:“ <”),错误似乎与Y值成正比,在这种类型的模型中是否可以纠正此问题?
agenis

1
最明显的解决方案(通常可以解决其他问题)是转换响应,最常见的是对数转换。
Ben Bolker
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.