Questions tagged «lme4-nlme»

lme4和nlme是用于拟合线性,广义线性和非线性混合效果模型的R包。对于有关混合模型的一般问题,请使用[mixed-model]标签。


1
R / mgcv:为什么te()和ti()张量积产生不同的曲面?
的mgcv软件包R具有两个功能,用于拟合张量积相互作用:te()和ti()。我了解两者之间的基本分工(拟合非线性交互与将这种交互分解为主要效果和交互)。我不明白的是为什么te(x1, x2)而ti(x1) + ti(x2) + ti(x1, x2)可能产生(略)不同的结果。 MWE(改编自?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
如何使用混合效应模型对交互作用词进行事后比较?
我正在研究一个数据集,以评估干燥对沉积物微生物活动的影响。目的是确定干燥的影响是否随沉积物类型和/或沉积物中深度的变化而变化。 实验设计如下: 第一因子沉积物对应于三种沉积物类型(编码为Sed1,Sed2,Sed3)。对于每种沉积物,在三个地点进行采样(Sed1为3个地点,Sed2为3个地点,Sed3为3个地点)。 网站编码:Site1,Site2,...,Site9。 下一个因素是水文:在每个站点内,在干地和湿地(编码为干/湿)中进行采样。 在每个上一个图中,以两个深度(D1,D2)一式三份进行采样。 总共有n = 108个样本= 3个沉积物* 3个地点* 2个水文学* 2个深度* 3个重复项。 我lme()在R(nlme软件包)中使用该函数,如下所示: Sediment <- as.factor(rep(c("Sed1","Sed2","Sed3"),each=36)) Site <- as.factor(rep(c("Site1","Site2","Site3","Site4","Site5", "Site6","Site7","Site8","Site9"),each=12)) Hydrology <- as.factor(rep(rep(c("Dry","Wet"),each=6),9)) Depth <- as.factor(rep(rep(c("D1","D2"),each=3),18)) Variable <- rnorm(108) mydata <- data.frame(Sediment,Site,Hydrology,Depth,Variable) mod1 <- lme(Variable ~ Sediment*Hydrology*Depth, data=mydata, random=~1|Site/Hydrology/Depth) anova(mod1) 我想进行事后比较,以测试一个术语是否有意义。 我能够做到这一点,以获得简单的主要效果(例如,沉积物): summary(glht(mod1,linfct=mcp(Sediment="Tukey"))) 但是该glht()功能不适用于交互条件。 我发现以下方法可以用于两向方差分析: mod1 <- lme(Variable~Sediment*Hydrology, …

1
将二项式GLMM(glmer)拟合为比例或分数的响应变量
我希望有人可以帮助解决我认为相对简单的问题,我想我知道答案,但未经证实,这已经成为我无法确定的事情。 我有一些计数数据作为响应变量,我想测量该变量如何随某物的比例存在而变化。 更详细地,响应变量是在多个站点中昆虫物种的存在的计数,因此例如采样一个站点10次,并且该物种可能出现4次。 我想看看这是否与这些地点植物整体群落中一组植物物种的比例存在相关。 这意味着我的数据如下所示(这只是一个示例) Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence 1, 5, 10, 0.5 2, 3, 10, 0.3 3, 7, 9, 0.6 4, 0, 9, 0.1 数据还包括位置的随机效应。 我想到了两种方法,一种是lmer将昆虫转换成一定比例的线性模型(),例如 lmer.model<-lmer(insectCount/NumberOfInsectSamples~ ProportionalPlantGroupPresence+(1|Location),data=Data) 第二个是二项式GLMM(glmer),例如 glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~ ProportionalPlantGroupPresence+(1|Location), data=Data,family="binomial") 我相信二项式聚光镜是正确的方法,但是它们会产生完全不同的结果。我似乎无法在网络上找到明确的答案,而仍然没有一点不确定性,并希望确保自己没有犯错。 任何帮助或对替代方法的见解将不胜感激。

1
使用时变协变量测试纵向混合模型中的同时和滞后效应
最近有人告诉我,如果不为这些协变量引入时滞,就不可能将时变协变量纳入纵向混合模型。您可以确认/否认吗?您对此情况有参考吗? 我提出一个简单的情况来澄清。假设我已经对40个受试者重复测量(说过30次)定量变量(y,x1,x2,x3)。通过问卷在每个受试者中对每个变量进行30次测量。在这里,最终数据将是嵌套在40个主题中的4 800个观察值(4个变量X 30场合X 40个主题)。 我想单独测试(不用于模型比较): 同时(同步)效果:时间t的x1,x2和x3对时间t的y的影响。 滞后效应:在时间t-1时x1,x2和x3对y的影响。 我希望一切都清楚(我不是说英语的人!)。 例如,在R lmer {lme4}中,具有滞后效应的公式为: lmer(y ~ lag1.x1 + lag1.x2 + lag1.x3 + (1|subject)) 其中y,在时间t处的因变量lag1.x1是,在各个级别上的滞后自变量x1,等等。 对于同时效果,公式为: lmer(y ~ x1 + x2 + x3 + (1|subject)) 一切运行良好,它给了我有趣的结果。但是,指定具有同步时变协变量的lmer模型是否正确,还是我错过了一些事情? 编辑: 此外,是否有可能同时测试同时和滞后效应?, 例如 : lmer(y ~ x1 + x2 + x3 + lag1.x1 + lag1.x2 + lag1.x3 …

1
重复测量方差分析:LM vs LMER
我试图重现两者之间lm以及lmer重复测量(2x2x2)之间的几个交互测试。我想比较这两种方法的原因是因为SPSS的重复测量GLM产生的结果与lm此处介绍的方法完全相同,因此最后我想比较SPSS与R-lmer。到目前为止,我仅设法(紧密地)复制了其中的一些交互。 您会在下面找到一个脚本来更好地说明我的观点: library(data.table) library(tidyr) library(lmerTest) library(MASS) set.seed(1) N <- 100 # number of subjects sigma <- 1 # popuplation sd rho <- .6 # correlation between variables # X1: a a a a b b b b # X2: a a b b a a b b # X3: a …

1
手动计算线性混合模型的随机效应预测
我试图手工从线性混合模型中计算随机效应预测,并使用伍德在广义加性模型中提供的表示法:R的简介(pdf的pg 294 / pg 307),我对每个参数的含义感到困惑代表。 以下是伍德的摘要。 定义线性混合模型 ÿ= Xβ+ Zb + ϵY=Xβ+Zb+ϵ Y = X\beta + Zb + \epsilon 其中b N(0,ψ),和ε 〜 N(0,σ 2)〜∼\simψψ\psiε 〜ϵ∼\epsilon \simσ2σ2\sigma^{2} 如果b和y是具有正态分布的随机变量 [by]∼N[[0Xβ],[ψΣybΣbyΣθσ2]][by]∼N[[0Xβ],[ψΣbyΣybΣθσ2]]\begin{align*} \begin{bmatrix} b\\ y \end{bmatrix} &\sim N \begin{bmatrix} \begin{bmatrix} 0\\ X\beta \end{bmatrix}\!\!,& \begin{bmatrix} \psi & \Sigma_{by} \\ \Sigma_{yb}& \Sigma_{\theta}\sigma^{2} \end{bmatrix} \end{bmatrix}\\ \end{align*} 可再生能源的预测是通过 …

2
如何模拟数据以证明与R(lme4)的混合效果?
作为这篇文章的对应内容,我致力于模拟具有连续变量的数据,使它们适合于相关的截距和斜率。 虽然有关于这一主题伟大的职位在网站上,并在现场之外,我在跨开始到结束例如即将与并联一个简单的,现实生活中的情景模拟数据有困难。 因此,问题是如何模拟这些数据,并使用进行“测试” lmer。对于许多人而言,这并不是什么新鲜事物,但对于其他许多试图了解混合模型的人来说,却可能有用。

1
混合效果模型的模型矩阵
在lmer函数内lme4的R存在是构建随机效应,模型矩阵的呼叫,作为解释在这里,7页- 9。ZZZ 计算需要两个矩阵和 KhatriRao和/或Kronecker积。 ZZZJiJiJ_iXiXiX_i 矩阵是一个的:“分组因子索引的指标矩阵”,但是它似乎是带有伪编码的稀疏矩阵,用于选择对应于较高层次级别的哪个单元(例如,重复测量的主题)在“任何观察。所述矩阵似乎作为在较低层级测量的选择器,以便两个“选择器”的组合将产生一矩阵,通过下面的例子中的纸张所示的形式的:JiJiJ_iXiXiX_iZiZiZ_i (f<-gl(3,2)) [1] 1 1 2 2 3 3 Levels: 1 2 3 (Ji<-t(as(f,Class="sparseMatrix"))) 6 x 3 sparse Matrix of class "dgCMatrix" 1 2 3 [1,] 1 . . [2,] 1 . . [3,] . 1 . [4,] . 1 . [5,] . . 1 …

1
在multcomp :: glht中对具有交互作用的混合效应模型(lme4)进行事后测试
我正在R(lme4包)中的线性混合效应模型上执行事后测试。我正在使用multcomp包(glht()函数)执行事后测试。 我的实验设计是重复测量,具有随机阻塞效应。这些模型被指定为: mymod <- lmer(variable ~ treatment * time + (1|block), data = mydata, REML = TRUE) 而不是在这里附上我的数据,我叫了数据的工作过warpbreaks的内multcomp包装。 data <- warpbreaks warpbreaks$rand <- NA 我添加了一个额外的随机变量来模拟我的“阻止”效果: warpbreaks$rand <- rep(c("foo", "bar", "bee"), nrow(warpbreaks)/3) 这模仿了我的模型: mod <- lmer(breaks ~ tension * wool + (1|rand), data = warpbreaks) 我知道“ 其他Multcomp示例-2 Way Anova”中的示例。该示例使您可以比较的张力水平wool。 如果我想做相反的事情-比较wool内的水平tension怎么办?(在我的情况下,这将是在时间水平(三至六月,七月,八月)内比较治疗水平(二至零,一)。 我已经提出了以下代码来执行此操作,但是它似乎不起作用(请参见下面的错误消息)。 …

1
比较混合效应模型和固定效应模型(测试随机效应的显着性)
给定三个变量y和x,它们是正连续的,而和z是分类的,我有两个候选模型,分别为: fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) ) 和 fit.fe <- lm( y ~ 1 + x ) 我希望比较这些模型,以确定哪种模型更合适。在我看来,从某种意义上讲,它fit.fe是嵌套的fit.me。通常,当这种一般情况成立时,可以执行卡方检验。在中R,我们可以使用以下命令执行此测试, anova(fit.fe,fit.me) 当两个模型包含随机效应(通过生成lmer从所述lme4包),则anova()命令工作正常。由于边界参数的存在,通常建议通过仿真测试所得的卡方统计量,尽管如此,我们仍可以在仿真过程中使用该统计量。 当两个模型都只包含固定效果时,此方法(以及相关的anova()命令)可以正常工作。 但是,当一个模型包含随机效应而精简模型仅包含固定效应时,如上述情况一样,该anova()命令将不起作用。 更具体地说,出现以下错误: > anova(fit.fe, fit.me) Error: $ operator not defined for this S4 class 从上方使用Chi-Square方法(模拟)有什么问题吗?还是这仅仅是anova()不知道如何处理由不同函数生成的线性模型的问题? 换句话说,手动生成从模型得出的卡方统计量是否合适?如果是这样,比较这些模型的适当自由度是多少?据我估计: F=((SSEreduced−SSEfull)/(p−k))((SSEfull)/(n−p−1))∼Fp−k,n−p−1F=((SSEreduced−SSEfull)/(p−k))((SSEfull)/(n−p−1))∼Fp−k,n−p−1 F …

1
随机斜率混合模型的类内相关系数
我为参与者()和项目()m_plot配备了以下lme4::lmer带有交叉随机效应的模型:lfdncontent Random effects: Groups Name Variance Std.Dev. Corr lfdn (Intercept) 172.173 13.121 role1 62.351 7.896 0.03 inference1 24.640 4.964 0.08 -0.30 inference2 52.366 7.236 -0.05 0.17 -0.83 inference3 21.295 4.615 -0.03 0.22 0.86 -0.77 content (Intercept) 23.872 4.886 role1 2.497 1.580 -1.00 inference1 18.929 4.351 0.52 -0.52 inference2 14.716 3.836 …

1
多层次建模的符号
一个需要指定用于训练多层模型(lmer从lme4 R库中使用)的公式总是能帮助我。我读了无数的教科书和教程,但从未正确地理解它。 因此,这是本教程中的一个示例,我希望看到公式中的公式。我们正在尝试根据不同的情景将语音频率建模为性别(女性的声音比男性普遍高)和人的态度(无论他/她以礼貌还是非正式的方式回答)的函数。同样,从subject专栏中您可以看到,每个人都经过多次测量。 > head(politeness, n=20) subject gender scenario attitude frequency 1 F1 F 1 pol 213.3 2 F1 F 1 inf 204.5 3 F1 F 2 pol 285.1 4 F1 F 2 inf 259.7 5 F1 F 3 pol 203.9 6 F1 F 3 inf 286.9 7 F1 F …

2
lmerTest :: anova中的自由度正确吗?它们与RM-ANOVA有很大不同
我正在分析R中反应时间实验的结果。 我进行了重复测量方差分析(1个受试者内部因素具有2个水平,而1个受试者之间因素具有2个水平)。我运行了一个类似的线性混合模型,我想使用ANOVA表的形式总结lmer结果lmerTest::anova。 不要误会我的意思:我没想到会有相同的结果,但是我不确定lmerTest::anova结果的自由度。在我看来,它反映的是ANOVA,而在主题级别上没有任何汇总。 我知道以下事实:在混合效应模型中计算自由度是很棘手的,但lmerTest::anova在更新的?pvalues主题(lme4包)中被提及为一种可能的解决方案。 这个计算正确吗?结果lmerTest::anova是否正确反映了指定的模型? 更新:我使个体差异更大。自由度lmerTest::anova与简单的方差不同,但是我仍然不确定,为什么它们对于主体内因素/相互作用如此之大。 # mini example with ANT dataset from ez package library(ez); library(lme4); library(lmerTest) # repeated measures ANOVA with ez package data(ANT) ANT.2 <- subset(ANT, !error) # update: make individual differences larger baseline.shift <- rnorm(length(unique(ANT.2$subnum)), 0, 50) ANT.2$rt <- ANT.2$rt + baseline.shift[as.numeric(ANT.2$subnum)] anova.ez <- ezANOVA(data = …

3
如何获得总体r平方变化的置信区间
为了简单的示例,假设有两个线性回归模型 模型1有三个预测,x1a,x2b,和x2c 模型2具有从模型1 3个预测和两个附加的预测x2a和x2b 有一个种群回归方程,其中模型1 解释的种群方差为,模型解释为 。模型2解释的种群中的增量方差为ρ2(1)ρ(1)2\rho^2_{(1)}ρ2(2)ρ(2)2\rho^2_{(2)}Δ ρ2= ρ2(2 )- ρ2(1 )Δρ2=ρ(2)2−ρ(1)2\Delta\rho^2 = \rho^2_{(2)} - \rho^2_{(1)} 我有兴趣获取\ Delta \ rho ^ 2的估计量的标准误差和置信区间Δ ρ2Δρ2\Delta\rho^2。虽然该示例分别涉及3个和2个预测变量,但我的研究兴趣涉及大量不同数量的预测变量(例如5个和30个)。我首先想到的是使用 Δ [R2一dĴ= r2一dj (2 )- - [R2一dĴ (1 )Δradj2=radj(2)2−radj(1)2\Delta r^2_{adj} = r^2_{adj(2)} - r^2_{adj(1)}作为估计量并进行引导,但是我不确定是否会适当的。 问题 是Δ [R2一dĴΔradj2\Delta r^2_{adj}一个合理的估计Δ ρ2Δρ2\Delta \rho^2? 如何获得总体r平方变化的置信区间(即Δ ρ2Δρ2\Delta\rho^2)? 引导Δ ρ2Δρ2\Delta\rho^2是否适合计算置信区间? 任何对模拟或已发表文献的引用也将受到欢迎。 范例程式码 如果有帮助,我在R中创建了一个小的模拟数据集,可用于演示答案: …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.