Questions tagged «controlling-for-a-variable»

5
一个“控制其他变量”到底如何?
这是引起这个问题的文章:不耐烦会使我们发胖吗? 我喜欢这篇文章,它很好地展示了“控制其他变量”(IQ,职业,收入,年龄等)的概念,以便最好地隔离所讨论的两个变量之间的真实关系。 您可以向我解释一下如何实际控制典型数据集上的变量吗? 例如,如果您有2个人的耐心程度和BMI相同,但收入不同,您将如何处理这些数据?您是否将他们分为收入,耐心和BMI相似的不同子组?但是,最终有数十个变量需要控制(IQ,职业,收入,年龄等),然后如何汇总这些(潜在地)100个子组?实际上,现在我已经说了出来,我有一种感觉是这种方法使错误的树陷入困境。 感谢您为我几年来一直想深入了解的事情提供任何信息...!

3
多元回归中的“其他所有条件”是什么意思?
当我们这样做多元回归,说我们正在寻找在平均变化在一个变化的变量变量,保存了在其他变量不变,什么值,我们持有的其他变量不变?他们的意思是?零?有什么价值吗?ÿyyXxx 我倾向于认为它具有任何价值。只是在寻求澄清。如果有人有证明,那也将是一件好事。

2
您如何“控制”一个因素/变量?
据我了解,“控制”在统计中可以有两个含义。 对照组:在实验中,未对对照组成员进行任何治疗。例如:安慰剂与药物:您将药物分配给一组而不是另一组(对照组),这也称为“对照实验”。 变量控制:分离特定自变量影响的技术。赋予该技术的其他一些名称是“占”,“保持常数”,“控制”,一些变量。例如:在一项足球观看研究中(喜欢或不喜欢),您可能想要消除性别的影响,因为我们认为性别会导致偏见,也就是说,男性可能比女性更喜欢它。 所以,我的问题是针对第(2)点。两个问题: 通常,您如何“控制” /“考虑”变量。使用什么技术?(就回归而言,方差分析框架)。 在上面的示例中,随机选择男性和女性是否构成控制?也就是说,“随机性”是控制其他效果的技术之一吗?

3
什么时候不宜控制变量?
我可以想到至少一个幼稚的例子。假设我想研究X和Z之间的关系。我还怀疑Y影响Z,所以我控制Y。但是,事实证明,我不知道X引起Y,Y引起Z。因此,通过控制对于Y,我“了解”了X和Z之间的关系,因为X在给定Y的情况下独立于Z。 现在,在前面的示例中,可能是我应该研究的关系是X和Y以及Y和Z之间的关系。但是,如果我事先知道这些事情,我就不会在第一名。我现在所做的研究表明,X和Z之间没有关系,事实并非如此。...X和Z是相关的。 在下面的依赖关系图中对此进行了说明。在正确的情况下,Z取决于X和Y,并且X和Y是独立的。我们正确地控制了Y以确定X和Z之间的关系。在左情况下,Z取决于依赖于X的Y。X和Z在给定Y的情况下是独立的,因此通过控制是的 我的问题基本上是“什么时候适合控制变量Y,什么时候不适合?” ...可能很难或不可能完全研究X和Y之间的关系,但是,例如,将Y控制在给定的水平是一个选项。在进行研究之前,我们如何决定?控制太多或太少的常见陷阱是什么? 引文表示赞赏。

4
梯度提升机的精度随着迭代次数的增加而降低
我正在通过caretR中的程序包尝试使用梯度增强机算法。 使用一个小的大学录取数据集,我运行了以下代码: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage = …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
当我们比较控制变量的组时,是否应该使用等效检验?
在许多考虑治疗和结果的论文中,我看到了可能被称为令人讨厌的变量的表(通常是“表1”)(通常是人口统计信息,有时是医疗状况),并带有显着性检验和文字测试,例如“各组大致相似,在XXXXX上没有明显差异,请参见表”。因此,明确的目标是表明分配给不同治疗方法的组是相似的。 但是,在我看来,这似乎是“接受空值”,而我们应该做的(或要求完成的)是对等的检验。 这可能适用于随机试验或观察性研究。我在这里想念什么吗?


3
变量匹配和统计控制等方法之间的联系是什么?
您经常会在研究文章中看到研究人员已经控制了某些变量。这可以通过诸如匹配,阻止等方法来完成。 但是我一直认为,控制变量是通过测量几个可能具有影响力的变量并对其进行一些统计分析而在统计上完成的,这可以在真实和准实验中完成。因此,例如,您将进行一项调查或其他测试,在其中您将测量自变量和一些可能混淆的变量并进行一些分析。 在准实验中可以控制变量吗? 变量匹配和统计控制等方法之间的联系是什么?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.