Questions tagged «multilevel-analysis»

对包括几个层次结构的数据集进行统计分析(例如,学生嵌套在学校嵌套的班级中或分层预测)。对于有关混合模型的问题,请使用[mixed-model]标签。对于嵌套的随机效果,请使用[嵌套数据]。

1
交叉与嵌套随机效应:它们有什么不同?如何在lme4中正确指定它们?
这是我对嵌套随机效应与交叉随机效应的理解: 当较低级别的因子仅出现在较高级别的因子的特定级别内时,会发生嵌套随机效应。 例如,班级内的学生在固定的时间点。 在lme4我看来,我们用两种等效方式中的任一种来表示嵌套数据的随机效应: (1|class/pupil) # or (1|class) + (1|class:pupil) 交叉随机效应意味着给定因子出现在上层因子的一个以上水平中。 例如,几年级的班级中有小学生。 在中lme4,我们将这样写: (1|class) + (1|pupil) 但是,当我查看特定的嵌套数据集时,我注意到两个模型公式给出的结果相同(下面的代码和输出)。但是,我看到了其他数据集,其中两个公式产生了不同的结果。那么这是怎么回事? mydata <- read.csv("https://web.archive.org/web/20160624172041if_/http://www-personal.umich.edu/~bwest/classroom.csv") # (the data is no longer at `http://www-personal.umich.edu/~bwest/classroom.csv` # hence the link to web.archive.org) # Crossed version: Linear mixed model fit by REML ['lmerMod'] Formula: mathgain ~ (1 | schoolid) …

8
生成与现有变量具有定义的相关性的随机变量
对于模拟研究,我必须生成随机变量,这些变量显示与现有变量的预定义(填充)相关性。ÿYY 我研究了这些R软件包copula,CDVine它们可以生成具有给定依赖关系结构的随机多变量分布。但是,不可能将结果变量之一固定为现有变量。 任何想法和现有功能的链接表示赞赏! 结论: 提出了两个有效的答案,有不同的解决方案: 一个R 脚本由卡拉卡尔,其计算与一个随机变量精确(样品)的相关性,以一个预定义的变量 我发现了一个R 函数,该函数计算与预定义变量具有定义的总体相关性的随机变量 [@ttnphns的补充:我可以自由地将问题标题从单个固定变量的情况扩展到任意数量的固定变量;即如何生成具有预定义正确性和一些固定的现有变量的变量]

8
在什么情况下应该使用多层次/层次分析?
在哪种情况下,应该考虑使用多级/层次分析而不是更基础/传统的分析(例如,ANOVA,OLS回归等)?在任何情况下都可以认为这是强制性的吗?在某些情况下使用多层次/层次分析不合适吗?最后,对于初学者来说,学习多层/层次分析有哪些好的资源?


2
“深度学习”与多层/分层建模之间有什么区别?
“深度学习”只是多层次/层次建模的另一个术语吗? 我比后者更熟悉后者,但是据我所知,主要区别不在于它们的定义,而是它们在其应用程序域中的使用和评估方式。 看起来,典型的“深度学习”应用程序中的节点数量更多,并且使用通用的层次结构形式,而多级建模的应用程序通常使用层次结构关系来模仿正在建模的生成过程。在应用统计(层次建模)域中使用通用层次结构将被视为现象的“不正确”模型,而对特定领域的层次结构进行建模可能被视为颠覆了制造通用深度学习机器的目标。 这两件事是否真的是同一台机器,但使用两种不同的名称,以两种不同的方式使用?

5
如何在机器学习中处理分层/嵌套数据
我将用一个例子来解释我的问题。假设您要根据以下属性预测个人的收入:{年龄,性别,国家/地区,城市}。你有一个像这样的训练数据集 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 1 1 2 62 M 71 4 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

3
“独立观察”是什么意思?
我试图理解独立观察的假设意味着什么。一些定义是: “只有当两个事件才是独立的。” (统计术语词典)P(一个∩ b )= P(一)* P(b )P(a∩b)=P(a)∗P(b)P(a \cap b) = P(a) * P(b) “一个事件的发生不会改变另一个事件的可能性”(维基百科)。 “对一个观察值进行采样不会影响对第二个观察值的选择”(David M. Lane)。 经常出现的依赖观察的一个例子是学生嵌套在教师中,如下所示。假设教师影响学生,但学生彼此不影响。 那么,这些数据如何违反这些定义?[学生= 1]的采样[等级= 7]不会影响下一个要采样的等级的概率分布。(或者是?如果是,那么观察1对下一个观察有何预测?) 如果我不进行测量 gender , 为什么观测结果是独立的teacher_id?它们不是以相同的方式影响观察结果吗? teacher_id student_id grade 1 1 7 1 2 7 1 3 6 2 4 8 2 5 8 2 6 9

1
自由度可以是非整数吗?
当我使用GAM时,它给了我剩余的DF为(代码的最后一行)。这意味着什么?超越GAM示例,通常,自由度可以是非整数吗?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees of freedom Residual Deviance: 177.4662 on 26.6 degrees of …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

3
新闻中的方程式:将多层次模型转换为普通受众
纽约时报对用于向纽约市教育工作者提供反馈的“增值”教师评估系统有很长的评论。lede是用于计算分数的等式-无需上下文即可呈现。修辞策略似乎是通过数学恐吓: 该文章的全文可在以下网站获得:http : //www.nytimes.com/2011/03/07/education/07winerip.html 作者迈克尔·怀恩里普(Michael Winerip)认为,该方程式的意义超出了马特·达蒙(Matt Damon)以外的任何人的理解能力,更不用说普通教师了: “艾萨克森女士的3.69预测分数的计算更加令人生畏。它基于32个变量-包括学生是否“在考试前一年保持了年级”,以及学生是否是“在考试前或考试后新来的城市”年。” 这32个变量被插入到一个统计模型中,该模型看起来像是在“善意狩猎”中只有Matt Damon能够解决的方程式之一。 这个过程看起来是透明的,但显然是泥泞的,即使对于像教师,校长和记者(我对此也犹豫不决)这样​​的聪明人来说也是如此。 艾萨克森女士可能有两个常春藤联盟学位,但她迷路了。她说:“我发现这是无法理解的。” 用简单的英语来说,艾萨克森女士对教育部试图告诉她的最好的猜测是:即使她的66名学生中有65名在州考试中获得了熟练的成绩,但她的3分中的3分应该是4分。 但这只是一个猜测。” 您将如何向外行解释该模型?仅供参考,完整的技术报告位于: http://schools.nyc.gov/NR/rdonlyres/A62750A4-B5F5-43C7-B9A3-F2B55CDF8949/87046/TDINYCTechnicalReportFinal072010.pdf 更新:Andrew Gelman在这里提供了他的想法:http : //www.stat.columbia.edu/~cook/movabletype/archives/2011/03/its_no_fun_bein.html

2
为什么方差上的被认为是弱的?
背景 最常用的方差弱先验之一是反伽玛,其参数(Gelman 2006)。α = 0.001 ,β= 0.001α=0.001,β=0.001\alpha =0.001, \beta=0.001 但是,此分布的90%CI约为。[ 3 × 1019,∞ ][3×1019,∞][3\times10^{19},\infty] library(pscl) sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001)) [1] 3.362941e+19 Inf 据此,我认为给出方差非常高的可能性很小,而方差小于1可能性很低。一世ģ (0.001 ,0.001 )IG(0.001,0.001)IG(0.001, 0.001)P(σ&lt; 1 | α = 0.001 ,β= 0.001 )= 0.006P(σ&lt;1|α=0.001,β=0.001)=0.006P(\sigma<1|\alpha=0.001, \beta=0.001)=0.006 pigamma(1, 0.001, 0.001) [1] 0.006312353 题 我是否缺少某些东西,或者这实际上是一个有用的信息? 更新以澄清,我之所以考虑这个“信息性”,是因为它非常强烈地声称方差巨大,并且远远超出了曾经测量的几乎任何方差的范围。 后续的大量方差估计的荟萃分析是否可以提供更合理的先验? 参考 Gelman2006。层次模型中方差参数的先验分布。贝叶斯分析1(3):515–533

2
分层模型中的Fisher信息
给定以下层次模型, 和 其中是正态分布。有没有办法来得到一个确切的表达式的边缘分布的Fisher信息给出Ç。也就是说,什么是Fisher信息: p(x | c)= \ int p(x | \ mu)p(\ mu | c)d \ mu 在给定c的情况下,我可以得到X的边际分布的表达式。但是区分wrt c然后接受期望似乎非常困难。我是否缺少明显的东西?任何帮助,将不胜感激。μ 〜大号一个p 升一Ç ë(0 ,Ç )Ñ(⋅ ,⋅ )X Ç p (X | C ^ )= ∫ p (X | μ )p (μ | C ^ )ð μ X ç çX∼N(μ,1),X∼N(μ,1), X \sim …

4
如何计算均值的置信区间?
想象一下,您重复了三次实验。在每个实验中,您收集三次重复的测量值。与三种实验方法之间的差异相比,一式三份趋于相当接近。计算总和非常容易。但是,如何计算总体均值的置信区间呢? 样本数据: 实验1:34、41、39 实验2:45、51、52 实验3:29、31、35 假设实验中的重复值与每个实验的平均值都遵循高斯分布。实验中变化的SD小于实验方法中的SD。还假设每个实验中这三个值没有顺序。每行中三个值的从左到右顺序完全是任意的。 一种简单的方法是先计算每个实验的平均值:38.0、49.3和31.7,然后计算这三个值的平均值及其95%置信区间。使用此方法,总体平均值为39.7,95%置信区间为17.4至61.9。 这种方法的问题在于它完全忽略了三份重复之间的差异。我想知道是否没有一个很好的方法来说明这种差异。

3
何时使用固定效果与使用集群SE?
假设您具有单个数据横截面,其中个人位于组内(例如,学校内的学生),并且您希望估计以下形式的模型:Y_i = a + B*X_i其中X是个人水平特征和a常数的向量。 在这种情况下,假设未观察到的组间异质性会使您的点估计B及其SE产生偏差,因为它与您所关注的独立变量相关。 一种选择是按小组(学校)对SE进行聚类。另一个是要包括FE组。另一个是同时使用。在这些选项之间进行选择时应该考虑什么?尤其不清楚为什么要按组将SE聚类并使用FE组。在我的特定情况下,我有35个小组,每个小组中有5,000个人。我已经按照本pdf中的讨论进行了讨论,但是对于为什么以及何时可以同时使用群集SE和固定效果尚不清楚。 (请讨论集群式SE与FE的优缺点,而不是建议我只采用多层次模型。)

1
聚类标准错误与多层次建模?
我浏览了几本书(Raudenbush和Bryk,Snijders和Bosker,Gelman和Hill等)和几篇文章(Gelman,Jusko,Primo和Jacobsmeier等),但我仍然没有真正地把头缠住使用聚类标准误差和多级建模之间的主要区别。 我了解手头上与研究问题有关的部分;您只能从多层建模中获得某些类型的答案。但是,例如,对于您的兴趣系数仅处于第二级的两级模型,采用一种方法相对于另一种方法有什么优势?在这种情况下,我不必担心进行预测或提取聚类的各个系数。 我已经发现的主要区别是,当聚类具有不相等的样本大小时,聚类标准误差会受到影响,并且多级建模的弱点在于它假定了随机系数分布的规格(而使用聚类标准误差是无模型的) 。 最后,是否所有这些都意味着对于表面上可以使用这两种方法的模型,我们应该在系数和标准误差方面得到相似的结果吗? 任何答复或有用的资源将不胜感激。

5
用于多层次结构方程建模的R包?
我想测试一个多阶段路径模型(例如,A预测B,B预测C,C预测D),其中所有变量都是嵌套在组中的单个观察值。到目前为止,我已经通过R中的多个独特的多级分析来做到这一点。 我更喜欢使用像SEM这样的技术,该技术可以让我同时测试多个路径(A-&gt; B-&gt; C-&gt; D),并且仍然可以正确处理2级(组中的个人)。 我了解MPLUS可以解决这个问题。我可以使用R包吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.