Questions tagged «mixed-model»

混合(aka多级或分层)模型是线性模型,其中包括固定效应和随机效应。它们用于对纵向或嵌套数据建模。

1
仅观察一次的随机效应将如何影响广义线性混合模型?
我有一个数据集,在该数据集中,我想用作随机效果的变量在某些级别上只有一个观察值。基于对先前问题的回答,我认为原则上可以。 我可以将混合模型与只有1个观察值的对象拟合吗? 随机截距模型-每个科目一次测量 但是,在第二个链接中,第一个答案指出: “ ...假设您没有使用广义线性混合模型GLMM,在这种情况下,过度分散的问题将发挥作用” 我正在考虑使用GLMM,但我真的不了解单次观察的随机效应水平将如何影响模型。 这是我要拟合的模型之一的示例。我正在研究鸟类,我想模拟人口和季节对迁徙期间停留次数的影响。我想将个人用作随机效应,因为对于某些个人,我拥有长达5年的数据。 library(dplyr) library(lme4) pop <- as.character(c("BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "NU", "NU", …

1
受限制的最大似然比小于
此问题处理线性模型的特定版本中的受限最大似然(REML)估计,即: Y=X(α)β+ϵ,ϵ∼Nn(0,Σ(α)),Y=X(α)β+ϵ,ϵ∼Nn(0,Σ(α)), Y = X(\alpha)\beta + \epsilon, \\ \epsilon\sim N_n(0, \Sigma(\alpha)), 其中为(Ñ × p)矩阵由参数化α ∈ [R ķ,因为是Σ (α )。β是令人讨厌的参数的未知向量;兴趣是在估计α,我们有ķ ≤ p « Ñ。通过最大可能性估计模型没有问题,但是我想使用REML。众所周知,参见例如LaMotte的,即似然甲' ÿ,其中阿是任何半正交矩阵,使得X(α)X(α)X(\alpha)n×pn×pn \times pα∈Rkα∈Rk\alpha \in \mathbb R^kΣ(α)Σ(α)\Sigma(\alpha)ββ\betaαα\alphak≤p≪nk≤p≪nk\leq p\ll nA′YA′YA'YAAA可以写成A′X=0A′X=0A'X=0 LREML(α∣Y)∝|X′X|1/2|Σ|−1/2|X′Σ−1X|−1/2exp{−12r′Σ−1r},r=(I−X(X′Σ−1X)+X′Σ−1)Y,LREML(α∣Y)∝|X′X|1/2|Σ|−1/2|X′Σ−1X|−1/2exp⁡{−12r′Σ−1r},r=(I−X(X′Σ−1X)+X′Σ−1)Y, L_{\text{REML}}(\alpha\mid Y) \propto\vert X'X\vert^{1/2} \vert \Sigma\vert^{-1/2}\vert X'\Sigma^{-1}X\vert^{-1/2}\exp\left\{-\frac{1}{2} r'\Sigma^{-1}r \right\}, \\ r = (I - X(X'\Sigma^{-1}X)^+X'\Sigma^{-1})Y, 当为完整列等级时XXX。 我的问题是,对于某些完全合理且科学有趣的,矩阵X (α …

1
为什么混合效应模型可以解决依赖关系?
假设我们对学生考试成绩如何受到这些学生学习时间的影响感兴趣。为了探究这种关系,我们可以运行下面的线性回归: exam.gradesi=a+β1×hours.studiedi+eiexam.gradesi=a+β1×hours.studiedi+ei \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + e_i 但是,如果我们从几所不同的学校对学生进行抽样调查,我们可能期望同一所学校的学生比来自不同学校的学生彼此更相似。为了解决此依赖性问题,许多教科书/网络上的建议是运行混合效果并以随机效果进入学校。因此,该模型将成为: exam.gradesi=a+β1×hours.studiedi+schoolj+eiexam.gradesi=a+β1×hours.studiedi+schoolj+ei \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + \text{school}_j + e_i 但为什么这个解决依赖问题存在于线性回归? 请回应,就像您正在与12岁的孩子聊天一样

1
R中的非线性混合效应回归
令人惊讶的是,我无法使用Google找到以下问题的答案: 我有一些个体的生物学数据,这些数据显示了乙状结肠的及时生长行为。因此,我希望使用标准的物流增长对其进行建模 P(t) = k*p0*exp(r*t) / (k+p0*(exp(r*t)-1)) 其中p0是t = 0处的起始值,k是t-> infinity处的渐近极限,r是生长速度。据我所知,我可以使用nls对此模型轻松地建模(我缺乏理解:为什么我不能通过缩放时间和数据来使用标准logit回归建模类似的东西?感谢:Nick,显然人们这样做了,例如比例,但很少见http://www.stata-journal.com/article.html?article=st0147。关于此切线的下一个问题是模型是否可以处理> 1的离群值。 现在,我希望允许对三个参数k,p0和r进行固定(主要是分类)和随机(单个ID,还可能是研究ID)影响。nlme是这样做的最好方法吗?SSlogis模型对于我想做的事情似乎很明智,这是正确的吗?以下任一个是明智的模型吗?我似乎无法正确设置起始值,并且update()仅适用于随机效果,而不适用于固定效果-有任何提示吗? nlme(y ~ k*p0*exp(r*t) / (k+p0*(exp(r*t)-1)), ## not working at all (bad numerical properties?) data = data, fixed = k + p0 + r ~ var1 + var2, random = k + p0 + r ~ 1|UID, start …

1
这是分析R中带有lme4的混合效果模型的可接受方法吗?
我有一个不平衡的重复测量数据集来进行分析,并且我已经读到大多数统计软件包使用ANOVA(即III型平方和)处理此问题的方式是错误的。因此,我想使用混合效应模型来分析这些数据。我已经在中阅读了很多有关混合模型的信息R,但是对于R混合效应模型我还是很陌生,对自己做的事情不是很自信。请注意,我还不能完全脱离“传统”方法,仍然需要和事后检验。ppp 我想知道以下方法是否有意义,或者我做错了什么。这是我的代码: # load packages library(lme4) library(languageR) library(LMERConvenienceFunctions) library(coda) library(pbkrtest) # import data my.data <- read.csv("data.csv") # create separate data frames for each DV & remove NAs region.data <- na.omit(data.frame(time=my.data$time, subject=my.data$subject, dv=my.data$dv1)) # output summary of data data.summary <- summary(region.data) # fit model # "time" is a factor with three …

2
LME()错误-达到迭代限制
在指定交叉混合效果模型时,我尝试包括交互。但是,我收到以下错误消息: Error in lme.formula(rate ~ nozzle, random = ~nozzle | operator, data = Flow) : nlminb problem, convergence error code = 1 message = iteration limit reached without convergence (10) 该模型具有以下特征:1. 3种喷嘴类型(固定效果)2. 5个操作员,每个操作员对3种喷嘴类型的燃油流量进行3次重复测量。 我被要求在模型中包括喷嘴类型和操作员之间的相互作用。这是我的模型代码: flow.lme <- lme(rate ~ nozzle, error= nozzle|operator, data=Flow) 为什么我会收到此错误消息?

3
固定/随机效应模型背后的概念
有人可以帮助我了解固定/随机效应模型吗?如果您已经消化了这些概念,则可以自己解释,也可以将我定向到具有特定地址(页码,章节等)的资源(书,笔记,网站),以便我可以毫无困惑地学习它们。 这是真的吗:“一般来说,我们有固定的影响,而具体情况是随机的”?如果描述从一般模型到具有固定和随机影响的特定模型,我将特别感谢您的帮助。

1
与二进制数据相关的方差划分和纵向变化
我正在使用逻辑线性混合效应模型(随机截距)分析175所学校中300,000名学生的数据。每个学生仅出现一次,数据跨越6年。 如何以类似于VPC / ICC的方式在学校和学生之间划分差异,以获得连续的结果?我看过这篇文章,提出了4种方法,其中A和B对我来说似乎很有趣,但是我想知道使用这两种方法可能有哪些优点/缺点,当然还有其他方法可以使用它。 如何比较每年(或任何其他时间段)的学校水平残差方差?到目前为止,我是通过按年份划分数据并针对每年的数据运行模型来完成此操作的,但我认为这是有缺陷的,因为:i)没有明显的理由可以按年份进行划分;ii)由于每年的固定效应估算值是不同的,因此逐年比较随机效应可能没有意义(这是我的直觉,如果有人能够更正式地解释这一点(如果正确),那将是很好的)。 注意:我在与Whuber和Macro 进行元讨论后重新写了这个问题

1
可用于分类变量(R中)的不同编码类型是什么?何时使用它们?
如果您拟合线性模型或混合模型,则可以使用不同类型的编码将类别或名义变量转换为估计参数的多个变量,例如虚拟编码(R默认)和效果编码。 我听说在进行交互时最好使用效果编码(有时称为偏差编码或对比度编码),但是可能存在哪些对比度,何时使用哪种类型的对比度? 上下文是R中使用的混合建模lme4,但我认为可以使用更广泛的响应。抱歉,如果我错过了类似的问题。 编辑:两个有用的链接是:效果编码和伪编码说明。

2
ARMA / ARIMA与混合效果建模有何关系?
在面板数据分析中,我使用了具有随机/混合效应的多级模型来处理自相关问题(即,观察结果随时间聚集在个体中),并添加了其他参数以调整一些时间规格和感兴趣的冲击。ARMA / ARIMA似乎旨在解决类似问题。 我在网上找到的资源讨论了时间序列(ARMA / ARIMA)或混合效应模型,但是除了建立在回归之上之外,我不了解两者之间的关系。可能要在多层次模型中使用ARMA / ARIMA吗?两者之间是等效还是多余? 讨论此问题的资源的答案或指针将是很棒的。

2
来自混合效应模型的预测值周围的置信区间是什么意思?
我在看这个页面并注意到R中lme和lmer的置信区间方法。对于不了解R的人,这些是生成混合效果或多级模型的函数。如果我在重复测量设计等方面具有固定效果,那么围绕预测值(类似于均值)的置信区间意味着什么?我可以理解,对于一个效果,您可以有一个合理的置信区间,但是在我看来,在这样的设计中,围绕预期均值的置信区间似乎是不可能的。承认随机变量会导致估计中的不确定性这一事实可能很大,但在那种情况下,从推断的意义上比较各个值根本毫无用处。要么, 我是否在这里遗漏了一些东西,或者我对情况的分析是正确的?... [并且可能是为什么没有在lmer中实现(但很容易在SAS中实现)的理由。:)]

4
后续行动:在ANOVA图表之间的混合内,估计的SE或实际的SE?
我目前正在整理一篇论文,从昨天开始偶然发现了这个问题,这使我向自己提出了同样的问题。更好地为我的图表提供来自数据的实际标准误差还是由ANOVA估算的误差? 由于昨天的问题相当具体,我的问题相当具体,我认为提出这个后续问题是适当的。 详细信息: 我已经在某个认知心理学领域(条件推理)中进行了一项实验,将两组(归纳和演绎指令,即受试者之间的操作)与两个受试者内部的操作(问题的类型和问题的内容)进行了比较。两个因素水平)。 结果看起来像这样(左侧面板显示的是ANOVA输出的SE值,右侧面板显示的是根据数据估算的SEs): 请注意,不同的行代表两个不同的组(即,对象间操作),而内部在x轴(即2x2因子水平)上绘制受试者操作。 在本文中,我提供了方差分析的相应结果,甚至提供了中间关键交叉交互的计划比较。SE在那里为读者提供了有关数据可变性的一些提示。我更倾向于使用SE,而不是标准偏差和置信区间,因为绘制SD并不常见,并且在比较对象之间和对象之间的CI时存在严重问题(因为肯定适用于SE,错误地推断出显着差异的情况并不常见从他们)。 重复我的问题:绘制从ANOVA估计的SE是更好还是我应该绘制从原始数据估计的SE? 更新: 我认为我应该对SE的估算值更加清楚。SPSS中的ANOVA输出为我estimated marginal means提供了相应的SE和CI。这是在左图中绘制的内容。据我了解,它们应该是残差的标准差。但是,当保存残差时,它们的SD不会以某种方式接近估计的SE。因此,一个次要的(可能是特定于SPSS的问题)将是:这些SE是 什么? 更新2:我终于设法编写了一个R函数,该函数应该能够像我最终喜欢的那样自行绘制(请参见我接受的答案)。如果有人有时间,如果您可以看一下,我将不胜感激。这里是。

5
混合效应模型:比较分组变量各个级别的随机方差分量
假设我有参与者,每个参与者给出响应20次,一种情况为10次,另一种情况为10次。我拟合了一个线性混合效应模型,比较了每种情况下的这是一个可重现的示例,使用中的包来模拟这种情况:ÿ ÿñNNÿYYÿYYlme4R library(lme4) fml <- "~ condition + (condition | participant_id)" d <- expand.grid(participant_id=1:40, trial_num=1:10) d <- rbind(cbind(d, condition="control"), cbind(d, condition="experimental")) set.seed(23432) d <- cbind(d, simulate(formula(fml), newparams=list(beta=c(0, .5), theta=c(.5, 0, 0), sigma=1), family=gaussian, newdata=d)) m <- lmer(paste("sim_1 ", fml), data=d) summary(m) 该模型m产生两个固定效应(条件的截距和斜率)和三个随机效应(参与者的随机截距,条件的参与者随机斜率和截距-斜率相关性)。 我想在统计上比较由定义的各组参与者的随机截距方差的大小condition(即,在对照和实验条件下分别计算以红色突出显示的方差分量,然后测试各分量的大小是否存在差异不为零)。我将如何做(最好在R中)? 奖金 假设该模型稍微复杂一些:参与者各自经历10次刺激,每次20次,一种情况发生10次,另一种情况发生10次。因此,有两组交叉的随机效应:参与者的随机效应和刺激的随机效应。这是一个可重现的示例: library(lme4) fml <- "~ condition …


6
面板数据与混合模型之间的差异
我想知道面板数据分析和混合模型分析之间的区别。据我所知,面板数据和混合模型都使用固定和随机效应。如果是这样,为什么它们有不同的名称?还是它们的同义词? 我阅读了以下文章,其中描述了固定,随机和混合效应的定义,但并不能完全回答我的问题:固定效应,随机效应和混合效应模型之间有什么区别? 如果有人可以向我介绍有关混合模型分析的简短参考(约200页),我也将不胜感激。补充一点,无论软件处理如何,我都希望使用混合建模参考。主要是混合建模的理论解释。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.