Questions tagged «cluster-sample»

4
梯度提升机的精度随着迭代次数的增加而降低
我正在通过caretR中的程序包尝试使用梯度增强机算法。 使用一个小的大学录取数据集,我运行了以下代码: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage = …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

3
将多级模型拟合到R中的复杂测量数据
我正在寻找有关如何在R中使用多级模型分析复杂调查数据的建议。我已使用该survey软件包对一级模型中选择的不平等概率进行加权,但是此软件包没有用于多层建模的功能。该lme4软件包非常适合用于多层建模,但是我不知道有一种方法可以在不同级别的聚类中包含权重。Asparouhov(2006)提出了问题: 多级模型通常用于分析群集抽样设计中的数据。但是,这样的抽样设计通常在集群级别和单个级别使用不相等的选择概率。在一个或两个级别上分配采样权重以反映这些概率。如果在任何一个级别上都忽略了采样权重,则参数估计值可能会出现明显偏差。 用于两级模型的一种方法是在MPLUS中实现的多级伪最大似然(MPML)估计器(Asparouhov等,α)。Carle(2009)回顾了主要的软件包,并提出了一些有关如何进行的建议: 为了使用复杂的调查数据和设计权重正确地执行MLM,分析人员需要可以在程序外部包括按比例缩放的权重并包括“新”缩放的权重而无需自动修改程序的软件。当前,三个主要的MLM软件程序允许这样做:Mplus(5.2),MLwiN(2.02)和GLLAMM。不幸的是,HLM和SAS都无法做到这一点。 West和Galecki(2013)给出了更新的评论,我将详细引用相关文章: 有时,分析人员希望使LMM适合从复杂设计的样本中收集的数据集(见Heeringa等,2010,第12章)。复杂的样本设计通常具有以下特征:将人群划分为各个阶层,从阶层内部对个体集群进行多阶段选择,以及集群和最终样本个体的选择概率均等。这些不平等的选择概率通常会导致构建个体的采样权重,从而确保在纳入分析时对描述性参数进行无偏估计。这些权重可能会针对调查无响应而进一步调整,并根据已知的总体总数进行校准。传统上,分析人员在估计回归模型时可能会考虑基于设计的方法来整合这些复杂的采样功能(Heeringa等,2010)。最近,统计学家已经开始探索基于模型的方法来分析这些数据,使用LMM来结合采样层的固定效应和采样群的随机效应。 开发基于模型的方法来分析这些数据的主要困难是选择适当的方法来合并抽样权重(有关问题的摘要,请参见Gelman,2007)。Pfeffermann等。(1998),Asparouhov和Muthen(2006)以及Rabe-Hesketh和Skrondal(2006)开发了用于以合并调查权重的方式估算多层次模型的理论,Rabe-Hesketh和Skrondal(2006),Carle(2009)和Heeringa等。(2010年,第12章)介绍了使用当前软件程序的应用程序,但这仍然是统计研究的活跃领域。能够适应LMM的软件过程处于实现迄今为止文献中提出的用于合并复杂设计特征的方法的各个阶段,分析人员在将LMM拟合到复杂的样本调查数据时需要考虑这一点。有兴趣将LMM拟合到从复杂样本调查收集的数据中的分析人员,将被吸引到能够将调查权重正确纳入估计程序(HLM,MLwiN,Mplus,xtmixed和gllamm)的程序。区域。 这使我想到我的问题:是否有人对将LMM拟合R中的复杂测量数据有最佳实践建议?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.