Questions tagged «lme4-nlme»

lme4和nlme是用于拟合线性,广义线性和非线性混合效果模型的R包。对于有关混合模型的一般问题,请使用[mixed-model]标签。

1
写出多层混合效应模型的数学方程
简历问题 我正在尝试给出混合效果模型的详细且简洁的数学表示。我lme4在R中使用该软件包。我的模型的正确数学表示是什么? 数据,科学问题和R代码 我的数据集由不同地区的物种组成。我正在测试某个物种的流行率是否在导致灭绝(灭绝不一定是永久性的;它可以重新定殖)或定居之后的时间内发生变化。 lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp)) 患病率是某个区域年份中某物种所占地层的比例 时间是一个连续变量,表示灭绝或定植的时间;它总是积极的 类型是具有两个级别的类别变量。这两个级别是“-”和“ +”。当type为-时,它是一个殖民化(默认级别)。当type为+时,表示灭绝。 Reg是具有9个级别的类别变量,表示区域 spp是分类变量;级别数因地区而异,在48级和144级之间变化。 换句话说:响应变量是患病率(占地层的比例)。固定效果包括1)和拦截,2)事件发生的时间以及3)事件发生的时间与事件类型(殖民化或灭绝)之间的相互作用。这3种固定效应中的每一种在区域之间随机变化。在一个区域内,每种效应在物种之间随机变化。 我试图弄清楚如何为模型编写数学方程式。我想我理解R代码中发生的事情(尽管,我确信我有一些知识空白,希望写出正式的数学表达式可以增进我的理解)。 我已经通过网络和这些论坛进行了很多搜索。可以肯定的是,我发现了大量有用的信息(也许我会在对此问题的编辑中链接到其中一些信息)。但是,我无法完全找到将R代码的“ Rosetta Stone”转换为数学公式(我对代码更满意)是否真的可以帮助我确认我正确理解了这些方程式。实际上,我知道已经存在一些差距,但是我们会解决的。 我的尝试 混合效应模型的基本形式,在矩阵表示法中为(我的理解):Y=Xβ+Zγ+ϵY=Xβ+Zγ+ϵ Y = X \beta + Z \gamma + \epsilon γX=⎡⎣⎢⎢1⋮1Δt⋮ΔtnΔt+⋮Δt+,n⎤⎦⎥⎥X=[1ΔtΔt+⋮⋮⋮1ΔtnΔt+,n] X = …

4
梯度提升机的精度随着迭代次数的增加而降低
我正在通过caretR中的程序包尝试使用梯度增强机算法。 使用一个小的大学录取数据集,我运行了以下代码: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage = …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
在原假设下,可交换样本背后的直觉是什么?
排列检验(也称为随机检验,重新随机检验或精确检验)非常有用,并且在t-test未满足例如要求的正态分布的假设以及通过按等级对值进行转换时派上用场非参数测试之类的测试Mann-Whitney-U-test会导致丢失更多信息。但是,在使用这种检验时,一个假设且唯一一个假设应该是原假设下样本的可交换性假设。还值得注意的是,当有两个以上的示例(如在coinR包中实现的示例)时,也可以应用这种方法。 您能用简单的英语用一些比喻语言或概念直觉来说明这一假设吗?这对于在像我这样的非统计学家中阐明这个被忽视的问题非常有用。 注意: 提及在相同假设下应用置换测试不成立或无效的情况将非常有帮助。 更新: 假设我随机从我所在地区的当地诊所收集了50个受试者。他们被随机分配为接受药物或安慰剂的比例为1:1。分别Par1在V1(基准),V2(3个月后)和V3(1年后)时测量了参数1 。根据特征A,所有50个主题都可以分为2组;正值= 20,负值=30。它们也可以基于特征B细分为另外2组;B阳性= 15,B阴性=35。 现在,我具有Par1所有访问中所有受试者的值。在可交换性的假设下,如果可以,我是否可以在Par1使用置换测试的水平之间进行比较: -将接受药物治疗的受试者与接受V2安慰剂治疗的受试者进行比较? -将具有特征A的对象与具有V2的特征B的对象进行比较? -比较在V2具有特征A的对象与在V3具有特征A的对象? -在哪种情况下,这种比较是无效的,并且违反了可交换性的假设?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
为什么不能将glmer(family = binomial)输出与手动实现的Gauss-Newton算法匹配?
我想将lmer(really glmer)的输出与一个玩具二项式示例进行匹配。我读过小插曲,并相信自己了解发生了什么事。 但是显然我没有。卡住后,我根据随机效应固定了“真相”,然后单独估计了固定效应。我在下面包含此代码。要查看其合法性,您可以注释掉+ Z %*% b.k它,并将其与常规glm的结果匹配。我希望借用一些聪明才智来弄清楚为什么在包含随机效果的情况下我无法匹配lmer的输出。 # Setup - hard coding simple data set df <- data.frame(x1 = rep(c(1:5), 3), subject = sort(rep(c(1:3), 5))) df$subject <- factor(df$subject) # True coefficient values beta <- matrix(c(-3.3, 1), ncol = 1) # Intercept and slope, respectively u <- matrix(c(-.5, .6, .9), ncol = …

1
仅观察一次的随机效应将如何影响广义线性混合模型?
我有一个数据集,在该数据集中,我想用作随机效果的变量在某些级别上只有一个观察值。基于对先前问题的回答,我认为原则上可以。 我可以将混合模型与只有1个观察值的对象拟合吗? 随机截距模型-每个科目一次测量 但是,在第二个链接中,第一个答案指出: “ ...假设您没有使用广义线性混合模型GLMM,在这种情况下,过度分散的问题将发挥作用” 我正在考虑使用GLMM,但我真的不了解单次观察的随机效应水平将如何影响模型。 这是我要拟合的模型之一的示例。我正在研究鸟类,我想模拟人口和季节对迁徙期间停留次数的影响。我想将个人用作随机效应,因为对于某些个人,我拥有长达5年的数据。 library(dplyr) library(lme4) pop <- as.character(c("BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "NU", "NU", …

1
似然比测试-LMER R-非嵌套模型
我目前正在审查一些工作,遇到了以下问题,这对我来说似乎是错误的。使用lmer拟合了两个混合模型(在R中)。这些模型是非嵌套的,并通过似然比测试进行比较。简而言之,这是我拥有的可复制示例: set.seed(105) Resp = rnorm(100) A = factor(rep(1:5,each=20)) B = factor(rep(1:2,times=50)) C = rep(1:4, times=25) m1 = lmer(Resp ~ A + (1|C), REML = TRUE) m2 = lmer(Resp ~ B + (1|C), REML = TRUE) anova(m1,m2) 据我所知,它lmer被用来计算对数似然,并且该anova语句使用具有通常自由度的卡方来测试模型之间的差异。这对我来说似乎不正确。如果是正确的话,有人知道有什么参考可以证明这一点吗?我知道依赖模拟的方法(Lewis等人的论文,2011年)和Vuong(1989年)开发的方法,但是我不认为这是在这里产生的。我认为该anova陈述的使用不正确。

1
这是分析R中带有lme4的混合效果模型的可接受方法吗?
我有一个不平衡的重复测量数据集来进行分析,并且我已经读到大多数统计软件包使用ANOVA(即III型平方和)处理此问题的方式是错误的。因此,我想使用混合效应模型来分析这些数据。我已经在中阅读了很多有关混合模型的信息R,但是对于R混合效应模型我还是很陌生,对自己做的事情不是很自信。请注意,我还不能完全脱离“传统”方法,仍然需要和事后检验。ppp 我想知道以下方法是否有意义,或者我做错了什么。这是我的代码: # load packages library(lme4) library(languageR) library(LMERConvenienceFunctions) library(coda) library(pbkrtest) # import data my.data <- read.csv("data.csv") # create separate data frames for each DV & remove NAs region.data <- na.omit(data.frame(time=my.data$time, subject=my.data$subject, dv=my.data$dv1)) # output summary of data data.summary <- summary(region.data) # fit model # "time" is a factor with three …

2
LME()错误-达到迭代限制
在指定交叉混合效果模型时,我尝试包括交互。但是,我收到以下错误消息: Error in lme.formula(rate ~ nozzle, random = ~nozzle | operator, data = Flow) : nlminb problem, convergence error code = 1 message = iteration limit reached without convergence (10) 该模型具有以下特征:1. 3种喷嘴类型(固定效果)2. 5个操作员,每个操作员对3种喷嘴类型的燃油流量进行3次重复测量。 我被要求在模型中包括喷嘴类型和操作员之间的相互作用。这是我的模型代码: flow.lme <- lme(rate ~ nozzle, error= nozzle|operator, data=Flow) 为什么我会收到此错误消息?

1
当包含分类变量之间的交互时,解释混合模型的回归输出
我对使用混合模型/ lmer有疑问。基本模型是这样的: lmer(DV ~ group * condition + (1|pptid), data= df) 组和条件都是两个因素:组具有两个级别(组A,组B),条件具有三个级别(条件1,条件2,条件3)。它是来自人类受试者的数据,因此pptid对每个人都是随机效应。 该模型找到以下带有p值的输出: Estimate MCMCmean HPD95lower HPD95upper pMCMC Pr(>|t|) (Intercept) 6.1372 6.1367 6.0418 6.2299 0.0005 0.0000 groupB -0.0614 -0.0602 -0.1941 0.0706 0.3820 0.3880 condition2 0.1150 0.1151 0.0800 0.1497 0.0005 0.0000 condition3 0.1000 0.1004 0.0633 0.1337 0.0005 0.0000 groupB:condition2 -0.1055 -0.1058 …

1
如何使用lmer估计具有随机效应的模型的方差成分并将其与lme结果进行比较
我进行了一项实验,从两个不同的来源人群中抚养了不同的家庭。每个家庭被分配两种治疗方法之一。实验结束后,我测量了每个人的几个特征。为了测试治疗或来源的效果以及它们之间的相互作用,我使用了以家庭为随机因素的线性混合效应模型,即 lme(fixed=Trait~Treatment*Source,random=~1|Family,method="ML") 到目前为止,到目前为止,我现在必须计算相对方差分量,即通过处理或源以及交互作用来解释的变化百分比。 没有随机效应,我可以轻松地使用平方和(SS)来计算每个因素所解释的方差。但是对于混合模型(带有ML估计),没有SS,因此我认为我也可以使用Treatment和Source作为随机效应来估计方差,即 lme(fixed=Trait~1,random=~(Treatment*Source)|Family, method="REML") 但是,在某些情况下,lme无法收敛,因此我使用了lme4软件包中的lmer: lmer(Trait~1+(Treatment*Source|Family),data=DATA) 在哪里使用摘要功能从模型中提取方差: model<-lmer(Trait~1+(Treatment*Source|Family),data=regrexpdat) results<-VarCorr(model) variances<-results[,3] 我得到与VarCorr函数相同的值。然后,我使用这些值以总和作为总变化量来计算实际的变化百分比。 我在努力挣扎的是对初始lme模型(以治疗和来源为固定效应)和随机模型以估计方差成分(以治疗和来源为随机效应)的结果的解释。我发现在大多数情况下,由每个因素解释的方差百分比与固定效应的重要性不符。 例如,对于性状HD,最初的lme暗示了相互作用的趋势以及对治疗的重要性。使用后退程序,我发现“治疗”有接近明显的趋势。但是,在估计方差成分时,我发现Source具有最高的方差,占总方差的26.7%。 LME: anova(lme(fixed=HD~as.factor(Treatment)*as.factor(Source),random=~1|as.factor(Family),method="ML",data=test),type="m") numDF denDF F-value p-value (Intercept) 1 426 0.044523 0.8330 as.factor(Treatment) 1 426 5.935189 0.0153 as.factor(Source) 1 11 0.042662 0.8401 as.factor(Treatment):as.factor(Source) 1 426 3.754112 0.0533 和lmer: summary(lmer(HD~1+(as.factor(Treatment)*as.factor(Source)|Family),data=regrexpdat)) Linear mixed model fit by REML Formula: …
14 r  anova  variance  lme4-nlme 

5
混合效应模型:比较分组变量各个级别的随机方差分量
假设我有参与者,每个参与者给出响应20次,一种情况为10次,另一种情况为10次。我拟合了一个线性混合效应模型,比较了每种情况下的这是一个可重现的示例,使用中的包来模拟这种情况:ÿ ÿñNNÿYYÿYYlme4R library(lme4) fml <- "~ condition + (condition | participant_id)" d <- expand.grid(participant_id=1:40, trial_num=1:10) d <- rbind(cbind(d, condition="control"), cbind(d, condition="experimental")) set.seed(23432) d <- cbind(d, simulate(formula(fml), newparams=list(beta=c(0, .5), theta=c(.5, 0, 0), sigma=1), family=gaussian, newdata=d)) m <- lmer(paste("sim_1 ", fml), data=d) summary(m) 该模型m产生两个固定效应(条件的截距和斜率)和三个随机效应(参与者的随机截距,条件的参与者随机斜率和截距-斜率相关性)。 我想在统计上比较由定义的各组参与者的随机截距方差的大小condition(即,在对照和实验条件下分别计算以红色突出显示的方差分量,然后测试各分量的大小是否存在差异不为零)。我将如何做(最好在R中)? 奖金 假设该模型稍微复杂一些:参与者各自经历10次刺激,每次20次,一种情况发生10次,另一种情况发生10次。因此,有两组交叉的随机效应:参与者的随机效应和刺激的随机效应。这是一个可重现的示例: library(lme4) fml <- "~ condition …

1
双胞胎研究数据的线性混合效应建模
假设我有一些响应变量,该变量是从第个家庭中的第个兄弟姐妹测得的。另外,从每个受试者同时收集了一些行为数据。我正在尝试使用以下线性混合效应模型来分析情况: j i x i jyijyijy_{ij}jjjiiixijxijx_{ij} yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} = \alpha_0 + \alpha_1 x_{ij} + \delta_{1i} x_{ij} + \varepsilon_{ij} 其中和分别是固定截距和斜率, 是随机斜率,而是残差。α 1 δ 1 我 ε 我Ĵα0α0\alpha_0α1α1\alpha_1δ1iδ1i\delta_{1i}εijεij\varepsilon_{ij} 随机效应和残余的假设是(假设每个家庭中只有两个同胞) ε 我Ĵδ1iδ1i\delta_{1i}εijεij\varepsilon_{ij} δ1 我(ε我1,ε我2)Ť〜dñ(0 ,τ2)〜dñ((0 ,0 )Ť,R )δ1i∼dN(0,τ2)(εi1,εi2)T∼dN((0,0)T,R)\begin{align} \delta_{1i} &\stackrel{d}{\sim} N(0, \tau^2) \\[5pt] (\varepsilon_{i1}, \varepsilon_{i2})^T &\stackrel{d}{\sim} N((0, 0)^T, R) \end{align} 其中是未知方差参数,方差-协方差结构是2 x 2形式的对称矩阵 - …

4
用R中的随机效应估计折断的棒/分段线性模型中的断点[包括代码和输出]
当我还需要估计其他随机效应时,有人可以告诉我如何让R估计分段线性模型中的断裂点(作为固定或随机参数)吗? 我在下面提供了一个玩具示例,该示例适合曲棍球杆/折断的杆回归,其随机点的斜率变化和y轴截距的随机变化为4的断裂点。我想估算断裂点而不是指定断裂点。它可以是随机效果(最好)或固定效果。 library(lme4) str(sleepstudy) #Basis functions bp = 4 b1 <- function(x, bp) ifelse(x < bp, bp - x, 0) b2 <- function(x, bp) ifelse(x < bp, 0, x - bp) #Mixed effects model with break point = 4 (mod <- lmer(Reaction ~ b1(Days, bp) + b2(Days, bp) + (b1(Days, …

1
复合对称情况下(0 + factor | group)和(1 | group)+(1 | group:factor)随机效应规格的等价关系
道格拉斯·贝茨(Douglas Bates)指出,以下模型是等效的:“如果向量值随机效应的方差-协方差矩阵具有一种特殊形式,称为复合对称”(本演示文稿中的幻灯片91): m1 <- lmer(y ~ factor + (0 + factor|group), data) m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data) 具体而言,贝茨使用以下示例: library(lme4) data("Machines", package = "MEMSS") m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines) m2a <- lmer(score ~ Machine + (1|Worker) + (1|Worker:Machine), Machines) 具有相应的输出: print(m1a, …

1
计算随机效应逻辑回归的ICC
我正在以以下形式运行逻辑回归模型: lmer(response~1+(1|site), family=binomial, REML = FALSE) 通常,我会根据截距和残差方差来计算ICC,但是模型摘要不包括残差方差。我该如何计算?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.