Questions tagged «repeated-measures»

当在同一单元(例如,受试者)上收集多个测量值时,将出现重复测量数据。将此标签与[anova]标签一起用于RM-ANOVA。

2
配对t检验是线性混合效应建模的特例
我们知道,配对t检验只是单向重复测量(或对象内)ANOVA以及线性混合效应模型的一种特殊情况,可以用Rme中的lme()函数的lme()函数进行演示如下所示。 #response data from 10 subjects under two conditions x1<-rnorm(10) x2<-1+rnorm(10) # Now create a dataframe for lme myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2)) names(myDat) <- c("y", "x", "subj") 当我运行以下配对t检验时: t.test(x1, x2, paired = TRUE) 我得到了这个结果(由于随机生成器,您将得到不同的结果): t = -2.3056, df = 9, p-value = 0.04657 …

2
如何在线性混合模型中选择随机效应和固定效应结构?
请从主题设计的两个方面考虑以下数据: df <- "http://personality-project.org/r/datasets/R.appendix4.data" df <- read.table(df,header=T) head(df) Observation Subject Task Valence Recall 1 1 Jim Free Neg 8 2 2 Jim Free Neu 9 3 3 Jim Free Pos 5 4 4 Jim Cued Neg 7 5 5 Jim Cued Neu 9 6 6 Jim Cued Pos 10 我想使用混合线性模型对此进行分析。考虑到所有可能的固定效应和随机效应,有多种可能的模型: …

1
预测建模-我们是否应该关注混合建模?
对于预测建模,我们是否需要关注统计概念,例如随机效应和观测值的非独立性(重复测量)?例如.... 我有5个直接邮件广告系列(一年中发生)的数据,这些数据具有各种属性和购买标记。理想情况下,我会结合使用所有这些数据来为广告系列制定时给定的客户属性建立购买模型。原因是购买事件很少见,我想使用尽可能多的信息。给定的客户有可能出现在1至5个广告系列中的任何位置-这意味着记录之间没有独立性。 使用时是否重要? 1)机器学习方法(例如,树,MLP,SVM) 2)统计方法(逻辑回归)? **ADD:** 我对预测建模的想法是,如果模型有效,请使用它。因此,我从未真正考虑过假设的重要性。考虑到我上面描述的情况,我很纳闷。 采取机器学习算法,例如MLP and SVM。这些已成功用于对二进制事件进行建模,例如上面的示例,而且还对时间序列数据进行了清晰的关联。然而,许多使用损失函数是似然的,并假设误差为id。例如,R中的梯度增强树gbm使用从二项式(第10页)得出的偏差损失函数。

2
针对两个受试者内因素在R中使用lme / lmer进行重复测量ANOVA
我正在尝试lme从nlme软件包中复制aov重复测量方差分析的结果。对于单因素重复测量实验和具有一个受试者间因素和一个受试者内因素的两因素实验,我已经做到了,但是对于在两个因素内的两个因素实验,我却遇到了麻烦主题因素。 一个例子如下所示。A和B是固定效应因子和subject是随机效应的因素。 set.seed(1) d <- data.frame( Y = rnorm(48), subject = factor(rep(1:12, 4)), A = factor(rep(1:2, each=24)), B = factor(rep(rep(1:2, each=12), 2))) summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d)) # Standard repeated measures ANOVA library(nlme) # Attempts: anova(lme(Y ~ A*B, data=d, random = ~ 1 | subject)) # not same as …

3
什么时候需要重复测量方差分析而不是混合效果模型?
为了回答这个问题,关于我的设计(我向参与者随机展示不同类别的图片的设计)是否是一个示例,我应该使用重复测量方差分析,我得到的答案是我应该使用混合模型,其中之一是原因是我有两种形式的依赖关系:主题和类别。 现在我的问题是:在进行这种重复测量设计时,是否总是总是以这种方式有两个依赖关系?也就是说,在什么情况下重复测量方差分析优于混合效果建模方法,为什么?

1
重复测量的不平衡混合效应方差分析
我有手术期间接受2种不同治疗方法治疗的患者的数据。我需要分析它对心率的影响。每15分钟测量一次心率。 鉴于每个患者的手术时间可能不同,因此每个患者可以进行7到10次心率测量。因此,应使用不平衡的设计。我正在使用R进行分析。并且一直在使用ez软件包重复测量混合效果方差分析。但是我不知道如何分析不平衡的数据。有人可以帮忙吗? 也欢迎有关如何分析数据的建议。 更新: 按照建议,我使用lmer函数拟合了数据,发现最好的模型是: heart.rate~ time + treatment + (1|id) + (0+time|id) + (0+treatment|time) 结果如下: Random effects: Groups Name Variance Std.Dev. Corr id time 0.00037139 0.019271 id (Intercept) 9.77814104 3.127002 time treat0 0.09981062 0.315928 treat1 1.82667634 1.351546 -0.504 Residual 2.70163305 1.643665 Number of obs: 378, groups: subj, 60; time, …

3
R?中的非参数重复测量多方方差分析
以下问题是一段时间以来对我而言最神圣的问题之一,我希望有人能够提供很好的建议。 我希望使用R执行非参数重复测量多方方差分析。 我已经在网上进行了一段时间的搜索和阅读,到目前为止,仅能找到以下几种情况的解决方案:Friedman测试单向非参数重复测量方差分析,有序回归与{car} Anova函数用于多路非参数方差分析等。部分解决方案不是我在此问题线程中寻找的。我在一段时间前发布的一篇文章中总结了到目前为止的发现(标题为:重复测量R的方差分析(函数和教程),以防万一。 如果我在网上阅读的内容是正确的,则可以使用混合序数回归模型(又称比例赔率模型)来完成此任务。 我发现了两个看似相关的软件包,但找不到关于该主题的任何插图: http://cran.r-project.org/web/packages/repolr/ http://cran.r-project.org/web/packages/ordinal/ 因此,对于这个主题来说,我是新手,我希望这里的人们能提供一些指导。 是否有关于该主题的任何教程/建议阅读的内容?甚至更好的是,有人可以建议一个简单的示例代码来说明如何在R中运行和分析此代码(例如:“非参数重复测量多方方差分析”)吗?

1
lmer模型使用哪种多重比较方法:lsmeans或glht?
我正在使用具有一个固定效果(条件)和两个随机效果(由于主题设计和配对而导致的参与者)的混合效果模型分析数据集。该模型是使用lme4包生成的exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)。 接下来,我针对没有固定效果(条件)的模型对该模型进行了似然比检验,结果有显着差异。我的数据集中有3个条件,因此我想进行多重比较,但不确定使用哪种方法。我在CrossValidated和其他论坛上发现了许多类似的问题,但我仍然很困惑。 据我所见,人们建议使用 1.该lsmeans包- lsmeans(exp.model,pairwise~condition)这给了我下面的输出: condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts contrast estimate SE df t.ratio p.value Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099 Condition1 - …

2
重复测量方差分析:正态性假设是什么?
我对重复测量方差分析中的正态性假设感到困惑。具体来说,我想知道究竟应该满足哪种常态。在阅读有关简历的文献和答案时,我遇到了这种假设的三种不同的措词。 每个(重复)条件中的因变量应正常分布。 人们常说rANOVA与ANOVA具有相同的假设,另外还有球形度。这就是Field的发现统计资料以及Wikipedia 关于该主题和Lowry的文章的主张。 残差(所有可能的对之间的差异?)应正态分布。 我发现在多个答案此声明CV(1,2)。通过将rANOVA 与配对t检验进行类比,这似乎也很直观。 应该满足多元正态性。 维基百科和此资源提到了这一点。另外,我知道,朗诺可以换用MANOVA,这可能值得这个要求。 这些等效吗?我知道多元正态性意味着DV的任何线性组合都是正态分布的,因此3.如果我正确理解后者,自然会包括2.。 如果这些都不相同,那么rANOVA的“真实”假设是什么?你能提供参考吗? 在我看来,对第一个主张的支持最大。但是,这与此处通常提供的答案不一致。 线性混合模型 由于@utobi的提示,我现在了解如何将rANOVA重新描述为线性混合模型。具体来说,为了建模血压随时间的变化,我将期望值建模为: 其中y i j是血压的测量值,a i是平均血压第i个对象的压力,而t i j为第i个对象被测量的第j次,b iE[yij]=ai+bitij,E[yij]=ai+bitij, \mathrm{E}\left[y_{ij}\right]=a_{i}+b_i t_{ij}, yijyijy_{ij}aiaia_{i}iiitijtijt_{ij}jjjiiibibib_i表示该变化的血压是跨学科的不同了。两种效果都被认为是随机的,因为受试者的样本只是人群的随机子集,这是最主要的兴趣所在。 最后,我尝试考虑这对正常性意味着什么,但收效甚微。释义McCulloch和Searle(2001,p。35. Eq。(2.14)): E[yij|ai]yij|aiai=ai∼indep. N(ai,σ2)∼i.i.d. N(a,σ2a)E[yij|ai]=aiyij|ai∼indep. N(ai,σ2)ai∼i.i.d. N(a,σa2)\begin{align} \mathrm{E}\left[y_{ij}|a_i\right] &= a_i \\[5pt] y_{ij}|a_i &\sim \mathrm{indep.}\ \mathcal{N}(a_i,\sigma^2) \\[5pt] a_i &\sim \mathrm{i.i.d.}\ \mathcal{N}(a,\sigma_a^2) \end{align} 我明白这意味着 4.每个人的数据都需要正态分布,但这在很少的时间点进行测试是不合理的。 我用第三种表达的意思是 5.各个主题的平均值呈正态分布。请注意,这是上述三种基础之上的另外两种不同的可能性。 McCulloch,CE和Searle,SR(2001)。广义模型,线性模型和混合模型。纽约:John …

1
在原假设下,可交换样本背后的直觉是什么?
排列检验(也称为随机检验,重新随机检验或精确检验)非常有用,并且在t-test未满足例如要求的正态分布的假设以及通过按等级对值进行转换时派上用场非参数测试之类的测试Mann-Whitney-U-test会导致丢失更多信息。但是,在使用这种检验时,一个假设且唯一一个假设应该是原假设下样本的可交换性假设。还值得注意的是,当有两个以上的示例(如在coinR包中实现的示例)时,也可以应用这种方法。 您能用简单的英语用一些比喻语言或概念直觉来说明这一假设吗?这对于在像我这样的非统计学家中阐明这个被忽视的问题非常有用。 注意: 提及在相同假设下应用置换测试不成立或无效的情况将非常有帮助。 更新: 假设我随机从我所在地区的当地诊所收集了50个受试者。他们被随机分配为接受药物或安慰剂的比例为1:1。分别Par1在V1(基准),V2(3个月后)和V3(1年后)时测量了参数1 。根据特征A,所有50个主题都可以分为2组;正值= 20,负值=30。它们也可以基于特征B细分为另外2组;B阳性= 15,B阴性=35。 现在,我具有Par1所有访问中所有受试者的值。在可交换性的假设下,如果可以,我是否可以在Par1使用置换测试的水平之间进行比较: -将接受药物治疗的受试者与接受V2安慰剂治疗的受试者进行比较? -将具有特征A的对象与具有V2的特征B的对象进行比较? -比较在V2具有特征A的对象与在V3具有特征A的对象? -在哪种情况下,这种比较是无效的,并且违反了可交换性的假设?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

2
重复测量随时间的小
我获得了用于分析研究的数据,以研究在四个不同时间点(治疗前,治疗结束的当天,治疗后4周和治疗后2-4个月)铁水平的影响。没有对照组。他们正在寻找在三个治疗后时间点的铁水平是否显着增加到治疗前(基线)水平的铁水平。11名患者具有基线水平,但只有8名患者具有所有4个时间点的完整数据(每个时间点 = 11、10、9和8)。不仅测量了铁水平,而且还在每个时间点采取了其他两个实验室测量值以与基线进行比较。ññn 关于如何分析,我有几个问题。我最初认为RM方差分析适用于分析此数据,但我担心样本量小,数据丢失以及数据的非正态分布。然后,我考虑使用Wilcoxon符号秩检验将每个后处理量度与基线进行比较,但随后遇到了多个比较的问题。但是,我读了一些文献,淡化了需要进行多次比较的情况。因此,总的来说,我正在处理小样本量,不完整的数据和多次比较(以及是否必要)。 我希望这一切都是有道理的。我是CrossValidated的新手,它是由同事在这里指导的,可以作为向经验丰富的统计学家学习的地方,因此,我感谢任何建议!谢谢! 编辑以添加来自注释的原始数据: 总共有四个时间点,结果变量是连续的。例如,每个时间点的结果类似于以下内容: Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14] 1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111] 2nd Post (n=9): [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156] 3rd Post …

2
来自混合效应模型的预测值周围的置信区间是什么意思?
我在看这个页面并注意到R中lme和lmer的置信区间方法。对于不了解R的人,这些是生成混合效果或多级模型的函数。如果我在重复测量设计等方面具有固定效果,那么围绕预测值(类似于均值)的置信区间意味着什么?我可以理解,对于一个效果,您可以有一个合理的置信区间,但是在我看来,在这样的设计中,围绕预期均值的置信区间似乎是不可能的。承认随机变量会导致估计中的不确定性这一事实可能很大,但在那种情况下,从推断的意义上比较各个值根本毫无用处。要么, 我是否在这里遗漏了一些东西,或者我对情况的分析是正确的?... [并且可能是为什么没有在lmer中实现(但很容易在SAS中实现)的理由。:)]

1
如何针对重复测量设计计算方差分析:R中的aov()vs lm()
标题说明了一切,我很困惑。下面的代码在R中运行重复的aov(),并运行我认为是等效的lm()的调用,但是它们返回不同的误差残差(尽管平方和相同)。 显然,来自aov()的残差和拟合值是模型中使用的残差和拟合值,因为它们的平方和加到summary(my.aov)中报告的每个模型/残差平方和。那么,应用于重复测量设计的实际线性模型是什么? set.seed(1) # make data frame, # 5 participants, with 2 experimental factors, each with 2 levels # factor1 is A, B # factor2 is 1, 2 DF <- data.frame(participant=factor(1:5), A.1=rnorm(5, 50, 20), A.2=rnorm(5, 100, 20), B.1=rnorm(5, 20, 20), B.2=rnorm(5, 50, 20)) # get our experimental conditions conditions <- …

3
分析纵向数据集时使用aov()和lme()有什么区别?
谁能告诉我使用aov()和lme()分析纵向数据之间的区别,以及如何解释这两种方法的结果? 下面,我使用aov()和分析相同的数据集,lme()并得到2个不同的结果。使用时aov(),我在治疗交互作用的时间上得到了显着的结果,但是在拟合线性混合模型时,通过治疗交互作用的时间是无关紧要的。 > UOP.kg.aov <- aov(UOP.kg~time*treat+Error(id), raw3.42) > summary(UOP.kg.aov) Error: id Df Sum Sq Mean Sq F value Pr(>F) treat 1 0.142 0.1421 0.0377 0.8471 Residuals 39 147.129 3.7725 Error: Within Df Sum Sq Mean Sq F value Pr(>F) time 1 194.087 194.087 534.3542 < 2e-16 *** time:treat 1 2.077 …

1
如何确定重复测量方差分析所需的样本量?
我需要有关重复测量方差分析的一些帮助。 我们正在调查某些病房中某些干预措施对降低血流感染(BSI)率的影响。我们计划每月获取一次BSI费率信息,首先是在没有干预的情况下12个月,然后在有干预的情况下12个月。 我们正在考虑进行时间序列或重复测量方差分析,在我对第一个方法没有太多想法之前,我希望使用后一个方法(额外的问题:时间点太少了吧?),但是接下来另一个问题是,我们需要多少病房才能证明干预对BSI率确实有统计学上的显着影响? 我想我要进行两个ANOVA,一个用于“干预之前”,一个用于“干预期间”,并且我认为“ ANOVA”在“干预之前”不应进行显着的F比率检验。 我二维地考虑“样本量”一词,无论是病房数还是重复测量数。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.