Questions tagged «mixed-model»

混合(aka多级或分层)模型是线性模型,其中包括固定效应和随机效应。它们用于对纵向或嵌套数据建模。

2
允许比较混合效应模型(主要是随机效应)
我一直在研究使用R中的lme4包进行的混合效果建模。我主要使用该lmer命令,因此我将通过使用该语法的代码提出问题。我想可能是一个简单的普遍问题,可以比较lmer使用基于相同数据集的似然比构造的任何两个模型吗?我相信答案必须是“否”,但我可能是错误的。我已经阅读了有关随机效应是否必须相同的信息,而随机效应的含义是什么呢?因此,我将举几个例子。我将从使用单词刺激的重复测量数据中获取它们,也许像Baayen(2008)这样的东西在解释中会很有用。 假设我有一个模型,其中有两个固定效果预测变量,我们将它们称为A和B,还有一些随机效果……感知它们的单词和主题。我可能会构建如下模型。 m <- lmer( y ~ A + B + (1|words) + (1|subjects) ) (请注意,我故意data =将其排除在外,REML = FALSE为了清晰起见,我们假设我的意思总是) 现在,以下模型中,哪些可以与上述模型的似然比进行比较,哪些不可以? m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) ) m2 <- lmer( y ~ A + B + (1|subjects) ) m3 <- lmer( y ~ A …

4
边缘情况下精度和召回率的正确值是多少?
精度定义为: p = true positives / (true positives + false positives) 对不对,作为true positives和false positives做法0,精度接近1? 召回相同的问题: r = true positives / (true positives + false negatives) 我目前正在实施统计测试,需要计算这些值,有时分母为0,我想知道在这种情况下应返回哪个值。 PS:请原谅,不恰当的标签,我想用recall,precision和limit,但我不能创造新的标签呢。
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

3
使用多重插补时如何为混合效果模型的方差成分组合置信区间
多重插补(MI)的逻辑是不对缺失值进行一次插补,而是对几次(通常为M = 5)次进行插补,从而得出M个完整的数据集。然后使用完整数据方法分析M个完整的数据集,然后使用Rubin公式将M个估计值及其标准误差组合在一起,以获得“总体”估计值及其标准误差。 到目前为止很好,但是当涉及到混合效果模型的方差成分时,我不确定如何应用此配方。方差分量的采样分布是不对称的-因此,不能以典型的“估计±1.96 * se(估计)”形式给出相应的置信区间。因此,R包lme4和nlme甚至不提供方差分量的标准误差,而仅提供置信区间。 因此,我们可以在数据集上执行MI,然后在M个完整的数据集上拟合相同的混合效应模型后,获得每个方差分量的M个置信区间。问题是如何将这M个区间合并为一个“总体”置信区间。 我想这应该是可能的-一篇文章的作者(yucel和demirtas(2010)非正常随机效应对MI推理的影响)似乎已经做到了,但是他们没有确切解释如何做。 任何提示将是非常义务! 干杯啦

2
配对t检验是线性混合效应建模的特例
我们知道,配对t检验只是单向重复测量(或对象内)ANOVA以及线性混合效应模型的一种特殊情况,可以用Rme中的lme()函数的lme()函数进行演示如下所示。 #response data from 10 subjects under two conditions x1<-rnorm(10) x2<-1+rnorm(10) # Now create a dataframe for lme myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2)) names(myDat) <- c("y", "x", "subj") 当我运行以下配对t检验时: t.test(x1, x2, paired = TRUE) 我得到了这个结果(由于随机生成器,您将得到不同的结果): t = -2.3056, df = 9, p-value = 0.04657 …

2
如何在线性混合模型中选择随机效应和固定效应结构?
请从主题设计的两个方面考虑以下数据: df <- "http://personality-project.org/r/datasets/R.appendix4.data" df <- read.table(df,header=T) head(df) Observation Subject Task Valence Recall 1 1 Jim Free Neg 8 2 2 Jim Free Neu 9 3 3 Jim Free Pos 5 4 4 Jim Cued Neg 7 5 5 Jim Cued Neu 9 6 6 Jim Cued Pos 10 我想使用混合线性模型对此进行分析。考虑到所有可能的固定效应和随机效应,有多种可能的模型: …


1
lmer()可以将样条曲线用作随机效果吗?
假设我们正在研究随时间推移一些计数数据的随机效应模型,并且我们希望控制某些趋势。通常,您会执行以下操作: lmer(counts ~ dependent_variable + (1+t+I(t^2)|ID), family="poisson") 为包括二次形状t。是否可以使用一些更复杂的平滑技术(如LOESS平滑器或样条线)来建立这种关系的模型?

3
解释“混合模型”的三种形式
有一个区别让我迷上了混合模型,我想知道我是否可以对此有所了解。假设您有一个计数数据的混合模型。有一个您要用作固定效果的变量(A)和另一个时间(T)变量,按“站点”变量分组。 据我了解: glmer(counts ~ A + T, data=data, family="Poisson") 是固定效果模型。 glmer(counts ~ (A + T | Site), data=data, family="Poisson") 是随机效应模型。 我的问题是,当您遇到以下情况时: glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")什么是T?这是随机效应吗?固定效果?将T放在两个地方实际上完成了什么? 什么时候仅应在模型公式的“随机效应”部分中显示?

4
在实践中,如何在混合效应模型中计算随机效应协方差矩阵?
基本上,我想知道的是如何实施不同的协方差结构,以及如何计算这些矩阵内的值。像lme()这样的函数允许我们选择所需的结构,但是我很想知道它们是如何估算的。 考虑线性混合效应模型。ÿ= Xβ+ Zu + ϵY=Xβ+Zu+ϵY=X\beta+Zu+\epsilon 其中和。此外:ε d 〜 Ñ (0 ,- [R )你〜dñ(0 ,D )u∼dN(0,D)u \stackrel{d}{\sim} N(0,D)ε 〜dñ(0 ,R )ϵ∼dN(0,R)\epsilon \stackrel{d}{\sim} N(0,R) V一个[R (ÿ| X,Z,β,u )= RVar(Y|X,Z,β,u)=RVar(Y|X,Z,\beta,u)=R V一个[R (ÿ| X,β)= Z′d ž+ R = VVar(Y|X,β)=Z′DZ+R=VVar(Y|X,\beta)=Z'DZ+R=V 为了简单起见,我们假设。R = σ2一世ñR=σ2InR=\sigma^2I_n 基本上我的问题是:对于各种参数设置,如何从数据中准确估算?假设我们假设是对角线的(随机效应是独立的)或完全参数化的(目前我比较感兴趣的情况)还是其他各种参数化中的任何一个?有没有简单的估计器/方程式?(毫无疑问,这是迭代估算的。)D DdDDdDDdDD 编辑: 从《方差组件》一书(Searle,Casella,McCulloch 2006),我设法做到以下几点: 如果则更新和计算方差成分,如下所示:D = σ2ü一世qD=σu2IqD=\sigma^2_uI_q σ2 (ķ + …

2
针对两个受试者内因素在R中使用lme / lmer进行重复测量ANOVA
我正在尝试lme从nlme软件包中复制aov重复测量方差分析的结果。对于单因素重复测量实验和具有一个受试者间因素和一个受试者内因素的两因素实验,我已经做到了,但是对于在两个因素内的两个因素实验,我却遇到了麻烦主题因素。 一个例子如下所示。A和B是固定效应因子和subject是随机效应的因素。 set.seed(1) d <- data.frame( Y = rnorm(48), subject = factor(rep(1:12, 4)), A = factor(rep(1:2, each=24)), B = factor(rep(rep(1:2, each=12), 2))) summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d)) # Standard repeated measures ANOVA library(nlme) # Attempts: anova(lme(Y ~ A*B, data=d, random = ~ 1 | subject)) # not same as …


5
Beta回归比例数据,包括1和0
我正在尝试生成一个模型,该模型的响应变量的比例在0和1之间,其中包括相当多的0和1,但也有介于两者之间的许多值。我正在考虑尝试beta回归。我为R(betareg)找到的程序包只允许0到1之间的值,但不包括0或1。我在其他地方读过,从理论上讲,β分布应该能够处理0或1的值,但是我不知道如何在RI中处理此问题,因为看到有人将0.001加到零并从中取0.001,但是我不是确定这是个好主意? 或者,我可以logit变换响应变量并使用线性回归。在这种情况下,我有0和1的相同问题,无法对它们进行日志转换。

3
什么时候需要重复测量方差分析而不是混合效果模型?
为了回答这个问题,关于我的设计(我向参与者随机展示不同类别的图片的设计)是否是一个示例,我应该使用重复测量方差分析,我得到的答案是我应该使用混合模型,其中之一是原因是我有两种形式的依赖关系:主题和类别。 现在我的问题是:在进行这种重复测量设计时,是否总是总是以这种方式有两个依赖关系?也就是说,在什么情况下重复测量方差分析优于混合效果建模方法,为什么?

1
备忘单ANOVA字母汤和回归等效项
我能否获得帮助以完成此暂定(正在进行中)的尝试,以了解与ANOVA和REGRESSION等效项的含义?我一直在尝试调和这两种方法的概念,术语和语法。这个站点上有很多关于它们的共性的帖子,例如this或this,但是在开始时有一张快速的“ you are here”地图仍然是一件好事。 我计划更新此帖子,并希望获得纠正错误的帮助。 单向方差分析: Structure: DV is continuous; IV is ONE FACTOR with different LEVELS. Scenario: miles-per-gal. vs cylinders Note that Income vs Gender (M, F) is a t-test. Syntax: fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit) Regression: fit <- lm(mpg ~ as.factor(cyl), mtcars) # …

1
聚类标准错误与多层次建模?
我浏览了几本书(Raudenbush和Bryk,Snijders和Bosker,Gelman和Hill等)和几篇文章(Gelman,Jusko,Primo和Jacobsmeier等),但我仍然没有真正地把头缠住使用聚类标准误差和多级建模之间的主要区别。 我了解手头上与研究问题有关的部分;您只能从多层建模中获得某些类型的答案。但是,例如,对于您的兴趣系数仅处于第二级的两级模型,采用一种方法相对于另一种方法有什么优势?在这种情况下,我不必担心进行预测或提取聚类的各个系数。 我已经发现的主要区别是,当聚类具有不相等的样本大小时,聚类标准误差会受到影响,并且多级建模的弱点在于它假定了随机系数分布的规格(而使用聚类标准误差是无模型的) 。 最后,是否所有这些都意味着对于表面上可以使用这两种方法的模型,我们应该在系数和标准误差方面得到相似的结果吗? 任何答复或有用的资源将不胜感激。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.