Questions tagged «repeated-measures»

当在同一单元(例如,受试者)上收集多个测量值时,将出现重复测量数据。将此标签与[anova]标签一起用于RM-ANOVA。

1
复合对称情况下(0 + factor | group)和(1 | group)+(1 | group:factor)随机效应规格的等价关系
道格拉斯·贝茨(Douglas Bates)指出,以下模型是等效的:“如果向量值随机效应的方差-协方差矩阵具有一种特殊形式,称为复合对称”(本演示文稿中的幻灯片91): m1 <- lmer(y ~ factor + (0 + factor|group), data) m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data) 具体而言,贝茨使用以下示例: library(lme4) data("Machines", package = "MEMSS") m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines) m2a <- lmer(score ~ Machine + (1|Worker) + (1|Worker:Machine), Machines) 具有相应的输出: print(m1a, …

2
是否有用于连续时间纵向二进制响应的R包?
该bild软件包似乎是用于串行二进制响应的出色软件包。但这是离散时间。我想为时间响应的平滑函数指定电流响应Y的比值比对与在较早时间测量的二进制响应,或者至少是一阶马尔可夫版本。我相信这称为交替逻辑回归。有谁知道R包可以处理连续时间,即测量时间可以在任何后续时间进行吗?我不需要模型中的随机效应。

2
我可以对重复的数据缩减措施进行PCA吗?
我在2种情况下分别对87只动物进行了3次试验(一些缺失数据;无缺失数据= 64只动物)。在一个情况下,我有很多具体措施(时间进入,次返回住所号等),所以我想开发描述在这方面的行为2至3复合行为评分(打电话给他们C1,C2,C3)。我希望C1在所有3个试验和87个动物中都具有相同的含义,以便我可以进行回归分析以检验年龄,性别,血统和单个动物对行为的影响。然后,我想研究C1在特定年龄段内其他情况下的行为得分与它们之间的关系。(在1岁时,上下文1中的活动是否强烈预测了上下文2中的活动?) 如果不采取重复措施,则PCA会很好用–对上下文的多个度量进行PCA,然后使用PC1,PC2等检查一个上下文中的PC1与PC1(或2或2)之间的关系(Spearman相关性)。 3)在其他情况下。问题是重复的措施,属于伪复制。我曾经有一个审阅者断言“不行”,但是我找不到任何明确的参考资料来说明在进行数据缩减时是否存在问题。 我的推理是这样的:重复的措施不是问题,因为我在PCA中所做的只是相对于原始措施的描述。如果我通过命令宣布我正在花时间进入竞技场作为上下文1中的“大胆”度量,那么我将获得上下文1大胆性度量,该度量在所有年龄段的所有个人中都是可比的,没有人会大吃一惊。如果我按法令声明我将使用的进入时间的进入远端时间,则同样。因此,如果我纯粹是出于还原目的使用PCA,为什么不能将其设为PC1(输入完成+ 0.5 ⋅ 0.28 ⋅ + 0.63 ⋅ + 0.02 ⋅0.5 ⋅0.5⋅0.5\cdot+ 0.5 ⋅ + 0.5⋅+\ 0.5\cdot0.28 ⋅0.28⋅0.28\cdot+ 0.63 ⋅ + 0.63⋅+\ 0.63\cdot+ 0.02 ⋅ + 0.02⋅+\ 0.02\cdot 总时间...),这至少是由我的多项指标所决定的,而不是我猜测进入时间通常是一种有益的,具有代表性的特征? (请注意,我对度量的基本结构不感兴趣……我的问题是关于我们如何解释特定于上下文的行为。哈里在上下文2中活跃吗?如果他随着年龄的增长而改变了我们在上下文1中所解释的活动,他是否还会在上下文2中改变其活动?) 我看过PARAFAC,看过SEM,但我不认为这两种方法对我的样本量更好或更合适。有人可以称体重吗?谢谢。

2
如果没有多级建模,如何在荟萃分析中处理研究内复制,而研究是复制的单位?
研究说明: 我已经观察到荟萃分析之间在研究内复制方面的一个常见错误。在陈述假设时,我不清楚错误是否使研究无效。但是,据我了解,这些假设违反了统计学的基本前提。 例如,一项研究测试了化学品对响应。ÿXXXÿYY 对数响应比率进行分析:处理(在的情况下)与控件(无)的比率: X Y 0 Xÿ+ XY+XY_{+X}XXXY0Y0Y_{0}XXX R=ln(Y+XY0)R=ln⁡(Y+XY0)R = \ln(\frac{Y_{+X}}{Y_{0}}) 荟萃分析中包含的某些研究包含多种处理方法,例如不同含量或化学形式。对于每种处理,都有一个不同的值,尽管始终使用相同的值。R R Y 0XXXRRRRRRY0Y0Y_0 方法说明: 在一项研究中对不同治疗(水平和形式)的反应被视为独立观察。XXX 问题: 这不是伪复制吗? 即使在方法中声明了违反独立性,这是否不合适? 在研究复制中进行处理的简便方法(例如,在简单的荟萃分析软件包的能力范围内)会是什么? 最初的想法: 总结每项研究的结果,例如通过平均反应 根据先验标准(例如最高剂量,首次测量)从每个研究中仅选择一种治疗? 还有其他解决方案吗?

1
从嘈杂的观察中确定真实均值
我有一大套形式的数据点(平均值,标准偏差)。我希望将其减少为单一(更好)的平均值,以及(希望)较小的标准偏差。 显然,我可以简单地计算,但是这没有考虑到某些数据点比其他数据点准确得多的事实。Σ d一个牛逼一米Ë 一个Ññ∑datameanN\frac{\sum data_{mean}}{N} 简而言之,我希望对这些数据点进行加权平均,但不知道在标准偏差方面加权函数应该是什么。


5
如何在大量数据点中进行值的插补?
我的数据集非常大,大约缺少5%的随机值。这些变量相互关联。以下示例R数据集只是一个具有虚拟相关数据的玩具示例。 set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds <- round ( runif(N, 1, length(xmat)) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
线性混合效应模型的报告结果
线性混合效应模型在我的生物学研究中并不常用,我需要报告我试图写的论文中使用的统计检验。我知道生物科学的某些领域(对依赖性的解决方案:使用多层次分析来容纳嵌套数据)已经开始出现对多层次建模的意识,但是我仍在尝试学习如何报告结果! 我的实验设计简而言之: *将受试者分配到四个治疗组中的一个 *在开始治疗后的不同天对因变量进行测量 *设计不平衡(治疗组中受试者人数不等,并且缺少某些天的测量值) *治疗A是参考类别 *我将数据集中在治疗的最后一天 我想知道治疗A(参考类别)是否比其他治疗(治疗结束)产生明显更好的结果。 我使用nlme在R中进行了分析: mymodel <- lme(dv ~ Treatment*Day, random = ~1|Subject, data = mydf, na.action = na.omit, + correlation = corAR1(form = ~1 |Subject), method = "REML") 输出(部分内容;为了简洁起见被截断)为: >anova(mymodel) numDF denDF F-value p-value (Intercept) 1 222 36173.09 <.0001 Treat 3 35 16.61 <.0001 Day …

1
R中重复测量的线性回归
我无法弄清楚如何在R in中执行线性回归以进行重复测量设计。在上一个问题(仍未回答)中,建议我不要使用lm而是使用混合模型。我lm以以下方式使用: lm.velocity_vs_Velocity_response <- lm(Velocity_response~Velocity*Subject, data=mydata) (有关数据集的更多详细信息,请参见上面的链接) 但是,我无法在Internet上找到任何带有R代码的示例,该示例显示了如何执行线性回归分析。 我想要的是,一方面是数据的图,一条线与数据相吻合,另一方面,值与p值一起用于模型的显着性检验。[R2R2R^2 有没有人可以提供一些建议?任何R代码示例都可能有很大帮助。 编辑 根据我到目前为止收到的建议,分析我的数据以了解两个变量Velocity_response(源自调查表)和Velocity(源自绩效)之间是否存在线性关系的解决方案应为: library(nlme) summary(lme(Velocity_response ~ Velocity*Subject, data=scrd, random= ~1|Subject)) 摘要的结果如下: > summary(lme(Velocity_response ~ Velocity*Subject, data=scrd, random= ~1|Subject)) Linear mixed-effects model fit by REML Data: scrd AIC BIC logLik 104.2542 126.1603 -30.1271 Random effects: Formula: ~1 | Subject (Intercept) Residual StdDev: …

2
如果某些时间点的响应严重偏斜,而某些时间点没有进行重复测量研究,该怎么办?
通常,当在纵向设计中遇到连续但偏斜的结果度量时(例如,具有一个对象间效应),通常的方法是将结果转换为正态。如果情况极端,例如观察结果被截断,则可能会花哨并使用Tobit生长曲线模型或类似的模型。 但是,当我看到结果通常在某些时间点分布然后在其他时间严重偏斜时,我会感到茫然。转换可能会堵塞一个泄漏,但会引发另一个泄漏。在这种情况下,您有什么建议?我是否不知道混合效果模型的“非参数”版本? 注意:一个应用示例是一系列教育干预措施前后的知识测验分数。分数开始正常,但随后聚集在量表的高端。

2
如何为使用汽车的重复测量方差分析指定特定的对比?
我正在尝试在R中运行重复测量Anova,然后对该数据集进行一些特定的对比。我认为正确的方法是 Anova()从汽车包装中使用。 让我们用?Anova使用 OBrienKaiser数据的示例来说明我的问题(注意:我省略了示例中的性别因素): 我们设计了一个在受试者因素,治疗之间(3个级别:对照,A,B)和两个重复的因素-测量(在受试者内)因素,阶段(3个级别:测试前,测试后,随访)和小时(5个级别:1至5)。 标准ANOVA表的给出方式为(与example(Anova)不同,我切换到Type 3 Squares of Squares,这是我的领域想要的): require(car) phase <- factor(rep(c("pretest", "posttest", "followup"), c(5, 5, 5)), levels=c("pretest", "posttest", "followup")) hour <- ordered(rep(1:5, 3)) idata <- data.frame(phase, hour) mod.ok <- lm(cbind(pre.1, pre.2, pre.3, pre.4, pre.5, post.1, post.2, post.3, post.4, post.5, fup.1, fup.2, fup.3, fup.4, fup.5) ~ treatment, data=OBrienKaiser) …

2
剖分方差分析:R中的模型比较测试
如何使用R中的X和M参数使用合适的模型比较来测试分割图方差分析中的效果anova.mlm()?我熟悉?anova.mlmDalgaard(2007)[1]。不幸的是,它只能刷分割图设计。在具有两个受试者内部因素的完全随机设计中进行此操作: N <- 20 # 20 subjects total P <- 3 # levels within-factor 1 Q <- 3 # levels within-factor 2 DV <- matrix(rnorm(N* P*Q), ncol=P*Q) # random data in wide format id <- expand.grid(IVw1=gl(P, 1), IVw2=gl(Q, 1)) # intra-subjects layout of data matrix library(car) # for Anova() fitA …

1
如何使用nlmer()对重复测量数据拟合非线性混合效应模型?
我正在尝试分析重复测量的数据,并努力使其在R。我的数据基本上如下,我有两个治疗组。每组中的每个主题每天都要接受测试,并给出分数(测试正确率)。数据为长格式: Time Percent Subject Group 1 0 GK11 Ethanol 2 0 GK11 Ethanol 3 0 GK11 Ethanol 4 0 GK11 Ethanol 5 0 GK11 Ethanol 6 0 GK11 Ethanol 数据类似于对数曲线,受试者在几天内表现很差,随后迅速改善,随后达到平稳状态。我想知道这种处理方法是否会对测试性能曲线产生影响。我的想法是在中使用nlmer()该lme4软件包R。我可以使用以下方法为每个组拟合线条: print(nm1 <- nlmer(Percent ~ SSlogis(Time,Asym, xmid, scal) ~ Asym | Subject, salinedata, start = c(Asym =.60, xmid = 23, scal …

2
什么是lme4 :: lmer等同于三向重复测量方差分析?
我的问题基于此回答,该回答表明哪个lme4::lmer模型对应于两次重复测量方差分析: require(lme4) set.seed(1234) d <- data.frame( y = rnorm(96), subject = factor(rep(1:12, 4)), a = factor(rep(1:2, each=24)), b = factor(rep(rep(1:2, each=12))), c = factor(rep(rep(1:2, each=48)))) # standard two-way repeated measures ANOVA: summary(aov(y~a*b+Error(subject/(a*b)), d[d$c == "1",])) # corresponding lmer call: anova(lmer(y ~ a*b+(1|subject) + (1|a:subject) + (1|b:subject), d[d$c == "1",])) 我现在的问题是如何将其扩展到三向方差分析的情况: …

1
面板/纵向数据的预测评估指标
我想评估几种不同的模型,这些模型可以每月提供行为预测。数据是平衡的, 100,000, 12。结果是在给定的月份参加音乐会,因此在任何月份中〜80%的人都为零,但是用户量很大,右尾长长。我的预测似乎并不尊重结果的计数性质:小规模音乐会很普遍。T =n=n=n=T=T=T= 我对模型一无所知。我每个人每个月只观察6种不同的黑匣子预测。我确实有额外的一年数据,模型制作者没有估算的数据(尽管一致参加者保持不变),我想评估每个数据在哪里表现良好(就准确性和准确性而言)。例如,某些模型对经常参加音乐会的人是否有很好的预测,但对沙发土豆却没有用?一月份的预测好于十二月的预测吗?另外,很高兴知道这些预测使我能够根据实际情况对人进行正确排名,即使无法相信确切的幅度。y^1,...,y^6y^1,...,y^6\hat y_1,...,\hat y_6 我的第一个想法是对预测的和时间的虚拟变量进行实际的固定效应回归,并查看每个模型的RMSE或。但这不能回答有关每个模型在哪里运行良好或差异是否显着的问题(除非我引导RMSE)。结果的分布也让我担心这种方法。R2R2R^2 我的第二个想法是将结果分为0、1-3和3+,然后计算混淆矩阵,但这会忽略时间维度,除非我将其设为12。这也很粗糙。 我知道concordTJ Steichen和NJ Cox所提供的Stata命令,它们可以by()选择,但是这需要将数据压缩到年度总数中。这将在其他有用的统计数据中,使用置信区间计算Lin的Concordance相关指数。CCC的范围是-1至1,完美的一致性为1。 还有Harrell的(由R. Newson 计算 ),可以选择,但是我不确定这是否允许我处理面板数据。这为您提供了置信区间。Harrell c是连续结果的ROC曲线(AUC)下面积的概括。它是可以排序的所有对的比例,以使具有较高预测值的对象实际上具有较高的结局。因此,对于随机预测,,对于完全区分的模型,。参见哈雷尔的书,第493页c = 0.5 c = 1cccsomersdclusterc=0.5c=0.5c=0.5c=1c=1c=1 您将如何解决这个问题?您是否建议计算预测中常见的统计数据(如MAPE)? 到目前为止发现的有用的东西: 幻灯片上的林的一致性相关系数的重复测量版本

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.