Questions tagged «multilevel-analysis»

对包括几个层次结构的数据集进行统计分析(例如,学生嵌套在学校嵌套的班级中或分层预测)。对于有关混合模型的问题,请使用[mixed-model]标签。对于嵌套的随机效果,请使用[嵌套数据]。

1
在PET-PEESE和用于荟萃分析的多层次方法之间陷入困境:是否有快乐的媒介?
我目前正在进行荟萃分析,为此我需要分析样本中嵌套的多个效应大小。与部分其他可能的策略(例如,忽略依赖性,在研究中平均效应大小,选择一种效应大小或转移分析单位)。我的许多因果效应大小的相关性都涉及相当独特(但局部相关)的变量,因此对它们进行平均计算在概念上是没有意义的,即使这样做,也将我要分析的总因果大小数减少了近一半。 但是,与此同时,我也对在评估荟萃分析效果的过程中使用Stanley&Doucouliagos(2014)的解决出版偏见的方法感兴趣。简而言之,要么适合使用一种元回归模型,即可通过其各自的方差(精密效果测试或PET)或各自的标准误差(带有标准误差的精密效果估计值或PEESE)来预测研究效果的大小。根据拦截模型在PET模型中的重要性,可以使用PET模型的拦截(如果PET拦截p > .05)或PEESE模型(如果PET拦截p <.05)作为估计的发布-无偏差平均效果大小。 但是,我的问题源于Stanley&Doucouliagos(2014)的摘录: 在我们的模拟中,总是包含过多的无法解释的异质性。因此,按照常规做法,应优先选择REE [随机效应估计器],而不是FEE [固定效应估计器]。但是,当选择出版物时,常规做法是错误的。通过选择具有统计意义的变量,REE总是比FEE更为偏见(表3)。这种可预测的劣势归因于以下事实:REE本身就是简单平均数(具有最大的发布偏差)和FEE的加权平均值。 这段话使我相信,我不应该在随机效应/混合效应荟萃分析模型中使用PET-PEESE,但是多层次的荟萃分析模型似乎需要一个随机效应估计量。 我为该做的事而感到痛苦。我希望能够对我所有的依存效应大小进行建模,但同时要利用这种特殊的出版偏倚校正方法。我是否可以通过某种方式将3级荟萃分析策略与PET-PEESE合法整合? 参考文献 张铭华(2014)。使用三级荟萃分析来建模依赖效应的大小:一种结构方程式建模方法。心理学方法,19,211-229。 Stanley,TD,&Doucouliagos,H.(2014年)。元回归近似可减少出版物选择的偏见。研究综合方法,5,60-78。

2
我应该在集群级别还是在个人级别进行引导?
我有一个将患者嵌套在医院中的生存模型,其中包括医院的随机效应。随机效应是伽马分布的,我试图以易于理解的规模报告该术语的“相关性”。 我发现以下使用中位数危险比(有点像中位数赔率)的参考文献进行了计算。 Bengtsson T,Dribe M:历史方法43:15,2010年 但是,现在我想使用自举报告该估计的不确定性。数据是生存数据,因此每个患者有多个观察结果,每个医院有多个患者。似乎很明显,我需要在重新采样时对患者的观察结果进行聚类。但是我不知道我是否也应该对医院进行聚类(即对医院重新采样,而不是对患者进行抽样? 我想知道答案是否取决于感兴趣的参数,如果目标是与患者有关而不是与医院有关的东西,那会有所不同吗? 如果有帮助,我在下面列出了Stata代码。 cap program drop est_mhr program define est_mhr, rclass stcox patient_var1 patient_var2 /// , shared(hospital) /// noshow local twoinvtheta2 = 2 / (e(theta)^2) local mhr = exp(sqrt(2*e(theta))*invF(`twoinvtheta2',`twoinvtheta2',0.75)) return scalar mhr = `mhr' end bootstrap r(mhr), reps(50) cluster(hospital): est_mhr

1
多层次建模的符号
一个需要指定用于训练多层模型(lmer从lme4 R库中使用)的公式总是能帮助我。我读了无数的教科书和教程,但从未正确地理解它。 因此,这是本教程中的一个示例,我希望看到公式中的公式。我们正在尝试根据不同的情景将语音频率建模为性别(女性的声音比男性普遍高)和人的态度(无论他/她以礼貌还是非正式的方式回答)的函数。同样,从subject专栏中您可以看到,每个人都经过多次测量。 > head(politeness, n=20) subject gender scenario attitude frequency 1 F1 F 1 pol 213.3 2 F1 F 1 inf 204.5 3 F1 F 2 pol 285.1 4 F1 F 2 inf 259.7 5 F1 F 3 pol 203.9 6 F1 F 3 inf 286.9 7 F1 F …


2
多重比较的层次模型-多重结果上下文
我刚刚(重新)阅读了格尔曼的《为什么我们(通常)不必担心多重比较》。特别是 “多重结果和其他挑战”部分提到在不同时间/条件下同一个人/单位有多个相关度量的情况下使用分层模型。它似乎具有许多理想的特性。 我了解这不一定是贝叶斯方法。有人可以告诉我如何使用rjags和/或lmer(常规JAGS和BUGS以及其他混合模型库,例如MCMCglmm)也可以正确地构建多变量多级模型,以便我可以进行比较和比较。对比结果?我想要模型的情况类型反映在下面的玩具数据中(多变量,重复测量): set.seed(69) id <- factor(rep(1:20, 2)) # subject identifier dv1 <- c(rnorm(20), rnorm(20, 0.8, 0.3)) # dependent variable 1 data for 2 conditions dv2 <- c(rnorm(20), rnorm(20, 0.3, 0.6)) dv3 <- c(rnorm(20), rnorm(20, -0.3, 0.8)) dv4 <- c(rnorm(20), rnorm(20, 0.2, 1 )) dv5 <- c(rnorm(20), rnorm(20, 0.5, 4 …

2
高度不规则的时间序列
我有一些不同鱼类种群的数据,这些数据是在大约5年的时间内采样的,但模式非常不规则。有时样本之间有几个月的间隔,有时一个月内有多个样本。也有很多0计数 如何处理此类数据? 我可以很容易地在R中绘制它的图形,但是这些图形并不是很特别,因为它们非常颠簸。 在建模方面-将物种建模为各种事物的函数-也许是混合模型(又称为多级模型)。 欢迎任何参考或想法 回应评论的一些细节 大约有15种。 我试图既了解每条鱼的任何趋势或季节性,又看一看物种之间的相互关系(我的客户最初想要一个简单的相关表) 目标是描述性和分析性的,而非预测性的 进一步的编辑:我确实找到了K. Rehfield等人的论文,该论文建议使用高斯核估计高度不规则时间序列的ACF http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf

2
在纵向研究中估计平均治疗效果的最佳方法是什么?
在一项纵向研究中,在时间点上重复测量了单位结果,总共有固定的测量时机(固定=单位测量同时进行)。我吨米Yitÿ一世ŤY_{it}i一世itŤtm米m 将单位随机分配给治疗或对照组。我想估计和测试平均治疗效果,即其中期望是跨时间和跨个人的。为此,我考虑使用固定时间的多层次(混合效果)模型:G = 0 A T E = E (Y | G = 1 )− E (Y | G = 0 ),G=1G=1个G=1G=0G=0G=0ATE=E(Y|G=1)−E(Y|G=0),ATE=E(Y|G=1)−E(Y|G=0),ATE=E(Y | G=1) - E(Y | G=0), Yit=α+βGi+u0i+eitYit=α+βGi+u0i+eitY_{it} = \alpha + \beta G_i + u_{0i} + e_{it} 与截距,的,横跨单元的无规截距,和残留。β 甲Ť é ù ëαα\alphaββ\betaATEATEATEuuueee 现在我正在考虑替代模型 Yit=β~Gi+∑j=1mκjdij+∑j=1mγjdijGi+u~0i+e~itYit=β~Gi+∑j=1mκjdiĴ+∑Ĵ=1个米γĴd一世ĴG一世+ü〜0一世+Ë〜一世ŤY_{it} = \tilde{\beta} G_i + \sum_{j=1}^m …

1
估计多级Logistic回归模型
以下多级逻辑模型,其中一个解释变量在级别1(个人级别),一个解释变量在级别2(组级别): π 0 Ĵ = γ 00 + γ 01 ż Ĵ + ü 0 Ĵ ... (2 )logit(pij)=π0j+π1jxij…(1)logit(pij)=π0j+π1jxij…(1)\text{logit}(p_{ij})=\pi_{0j}+\pi_{1j}x_{ij}\ldots (1) π0 Ĵ= γ00+ γ01žĴ+ 你0 Ĵ… (2 )π0j=γ00+γ01zj+u0j…(2)\pi_{0j}=\gamma_{00}+\gamma_{01}z_j+u_{0j}\ldots (2) π1 Ĵ= γ10+ γ11žĴ+ 你1 Ĵ… (3 )π1j=γ10+γ11zj+u1j…(3)\pi_{1j}=\gamma_{10}+\gamma_{11}z_j+u_{1j}\ldots (3) 其中,假定组级别残差ü0 Ĵu0ju_{0j}和ü1 Ĵu1ju_{1j}具有期望值为零的多元正态分布。残留误差 u_ {0j}的方差ü0 Ĵu0ju_{0j}指定为σ20σ02\sigma^2_0,残留误差u_ {1j}的方差 ü1 Ĵu1ju_{1j}指定为σ21个σ12\sigma^2_1。 我想估算模型的参数,并且喜欢使用 Rcommand glmmPQL。 …

2
混合效应模型中的“方差成分参数”是什么?
在贝茨关于混合效果模型的书的第12页上,他对模型进行了如下描述: 在屏幕快照的结尾处,他提到了 相对协方差因子 ,这取决于方差分量参数,θΛθΛθ\Lambda_{\theta}θθ\theta 没有解释到底是什么关系。假设我们给出,我们如何获得Λ θ从它?θθ\thetaΛθΛθ\Lambda_{\theta} 与此相关的是,这是我发现贝茨的论述缺乏细节的众多例子之一。是否有更好的文字实际经过参数估计的优化过程和测试统计量分布的证明?

2
混合模型的参数,半参数和非参数引导
接下来的嫁接摘自本文。我是新手,要引导并尝试为带有R boot包的线性混合模型实现参数,半参数和非参数自举。 R代码 这是我的R代码: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out 问题 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 




2
计算数据的ROC曲线
因此,我进行了16次试验,试图使用汉明距离从生物特征中鉴定一个人。我的阈值设置为3.5。我的数据如下,只有试验1为“真阳性”: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 我的困惑是,我真的不确定如何根据此数据制作ROC曲线(FPR与TPR或FAR与FRR)。哪一个都不重要,但是我只是对如何进行计算感到困惑。任何帮助,将不胜感激。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
我可以将混合模型与只有1个观察值的对象拟合吗?
我有一个非常大的数据集,随着时间的推移,我对各个位置进行了重复测量。有些位置可能有10个数据点,而有些位置只有1个数据点。我拟合了混合模型,并将位置用作随机效果。我的问题是我是否仍可以使用只有1个数据点的位置(因为您不能仅用1个数据绘制回归线)还是应该排除这些位置?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.