Questions tagged «confounding»

在统计模型中,当响应对预测变量的表观依赖性部分或全部是由于对模型中未包含的第三变量的依赖关系或对包含在模型中的其他变量的线性组合的依赖引起的,则发生混淆该模型。与模型中包含的变量混淆通常称为多重共线性。别名是* aliasing *,用于实验设计。

5
一个“控制其他变量”到底如何?
这是引起这个问题的文章:不耐烦会使我们发胖吗? 我喜欢这篇文章,它很好地展示了“控制其他变量”(IQ,职业,收入,年龄等)的概念,以便最好地隔离所讨论的两个变量之间的真实关系。 您可以向我解释一下如何实际控制典型数据集上的变量吗? 例如,如果您有2个人的耐心程度和BMI相同,但收入不同,您将如何处理这些数据?您是否将他们分为收入,耐心和BMI相似的不同子组?但是,最终有数十个变量需要控制(IQ,职业,收入,年龄等),然后如何汇总这些(潜在地)100个子组?实际上,现在我已经说了出来,我有一种感觉是这种方法使错误的树陷入困境。 感谢您为我几年来一直想深入了解的事情提供任何信息...!

15
2016年美国大选结果:预测模型出了什么问题?
首先是英国脱欧,现在是美国大选。许多模型预测大都偏离了,这里有教训可学吗?截至太平洋标准时间(PST)昨天下午4点,博彩市场仍以4比1的优势吸引了希拉里。 我认为,有真实货币的博彩市场应该充当那里所有可用预测模型的集合。因此,说这些模型做得并不好是不为过的。 我看到一个解释是,选民不愿将自己确定为特朗普的支持者。模型如何包含这样的效果? 我读到的一个宏观解释是民粹主义的兴起。那么问题是统计模型如何捕获这样的宏观趋势? 这些预测模型是否过多地强调了民意测验和情绪数据,而从该国100年的角度来看,这些数据还不够?我引用朋友的评论。

3
应该选择哪家医院?一个具有较高的成功率,但另一个具有较高的总体成功率
我对统计老师说的以下问题有疑问。我的问题甚至不在这种情况下发生的辛普森悖论上。我的问题仅仅是我的教授坚持认为A)和D)是正确的答案,而不是A)和F)。他说: “由于E型手术的成功率很低,我们可以得出结论,这很困难,而且不仅仅罕见。因此,与Hope相比,Mercy可能拥有更好的设备/医生。” 我不了解他如何从统计学上推断出Mercy做了“更困难的手术”。Mercy显然在E型手术中具有更高的成功率,但是为什么这意味着他们进行“更困难的手术”。我想我被这个问题的措词所困扰,而教授并没有让步。有人可以向我解释为什么我错了,或者如何向教授解释这一点吗? 您所在的镇有两家名为Mercy和Hope的医院。您必须选择其中一项进行操作。您决定以他们的外科团队的成功为基础。幸运的是,根据新的医疗计划,医院会提供有关手术成功与否的数据,这些数据分为五大类。假设您获得了两家医院的以下数据: Mercy Hospital Type A B C D E All Operations 359 1836 299 2086 149 4729 Successful 292 1449 179 434 13 2366 Hope Hospital Type A B C D E All Operations 88 514 222 86 45 955 Successful 70 391 113 12 2 588 …

3
我们真的需要包括“所有相关的预测变量”吗?
使用回归模型进行推理的基本假设是,“所有相关的预测变量”已包含在预测方程式中。理由是未能包含重要的现实因素会导致系数出现偏差,从而导致推论不准确(即省略了可变偏差)。 但是,在研究实践中,我从未见过任何类似 “所有相关预测变量”的事物。许多现象有许多重要原因,要把它们全部包括在内,将是非常困难的,即使不是不可能的话。一个现成的例子就是将抑郁症建模为结果:没有人建立类似于“所有相关变量”的模型的任何东西:例如,父母的历史,人格特质,社会支持,收入,他们的互动等,等等... 此外,除非有非常大的样本量,否则拟合这样一个复杂的模型将导致高度不稳定的估计。 我的问题很简单:“包含所有相关预测变量”的假设/建议是否只是我们“说”但实际上没有表达的意思?如果不是,那么我们为什么要提供它作为实际的建模建议? 这是否意味着大多数系数可能会产生误导?(例如,仅使用几种预测因子的人格因素和抑郁症研究)。换句话说,对于我们的科学结论而言,这有多大的问题?

1
混杂因素-定义
根据卡茨(M. Katz)在其《多变量分析》(第1.2节,第6页)中的说法,“ 混杂因素与风险因素相关,并且与结果有因果关系。 ”为什么混杂因素必须与结果有因果关系?将混杂因素与结果关联起来就足够了吗?

1
比率分析技术
我正在寻找有关比率和费率分析的建议和意见。在我工作的领域中,尤其是比率的分析非常普遍,但是我已经阅读了几篇论文,表明这可能是有问题的,我在想: Kronmal,Richard A.1993。重新讨论了比率标准的虚假相关和谬误。皇家统计协会杂志A 156(3):379-392 及相关论文。根据我到目前为止所读的内容,比率似乎可以产生虚假的相关性,迫使回归线穿过原点(这并不总是合适的),并且如果不正确地进行建模,可能会违反边际原理(在理查德·戈德斯坦(Richard Goldstein)中使用比率回归))。但是,在某些情况下必须合理使用比率,我希望统计学家对此发表一些意见。


3
实验设计中可能存在的混淆
问题概述 警告:这个问题需要很多设置。请多多包涵。 我和我的一位同事正在进行实验设计。设计必须解决许多约束,我将在下面列出。我已经开发出一种可以满足约束条件的设计,并且可以对我们的利益产生无偏的估计。但是,我的同事认为设计中存在混淆。我们在没有解决问题的情况下就这一点进行了辩论,因此,在此我想提出一些外部意见。 我将在下面描述研究的目标,我们的制约因素,潜在的困惑以及为什么我相信这个“​​困惑”不是问题。在阅读每一部分时,请记住我的总体问题: 我描述的设计中是否有混淆? [此实验的细节已修改,但提出我的问题所需的基本要素保持不变] 实验目标 我们希望确定白人男性撰写的论文是否比白人女性,黑人男性或黑人女性撰写的论文(论文作者身份变量)更受好评。我们还希望确定我们发现的任何偏差在高质量或低质量的赠款(质量变量)中是否显示更多。最后,我们希望包括有关12个不同主题(主题变量)的论文。但是,只有前两个变量具有实质意义。尽管主题必须随文章的不同而不同,但是我们对评估在主题之间的不同方式没有实质性的兴趣。 约束条件 我们可以收集的参与者数量和论文数量都有限制。结果是,作者身份不能完全在参与者之间操纵,也不能完全在论文之间操纵(即,每篇单独的论文必须分配给多个条件)。 尽管每篇文章都可以有白人,白人,黑人和黑人女性,但是每篇文章只能是高质量和低质量之一,并且只能涉及一个主题。或者,以不同的方式施加此约束,论文中的质量和主题都无法操纵,因为它们是给定论文的固有特征。 由于疲劳,给定参与者可以评估的论文数量有限。 给定人员阅读的所有文章都必须与单个主题有关。换句话说,不能将论文完全随机地分配给参与者,因为我们需要确保每个参与者仅阅读相似主题的论文。 每个参与者只能查看一个据称由非白人男性作者撰写的论文,因为我们不希望参与者对实验的目的产生怀疑,因为他们的论文太多是由黑人或女性作者撰写的。 拟议的设计 我提出的设计首先将每篇文章分成4种不同的作者版本(白人男性,白人女性等)。然后,使用来自相似主题的四篇论文来定义一个“集合”,每篇论文都由两篇高质量和两篇低质量的论文组成。每个参与者从给定的集合中收到三篇论文,如下图所示。然后,每个参与者对他或她分配的三篇论文中的每篇论文都提供一个单独的评分。 潜在的困惑 我的同事认为上述设计存在混淆。他说,问题在于,当高质量的论文被指派由非白人男性作家撰写时,它总是与一篇高质量的论文和一部劣质的论文配对(关于论文1,请参见参与者1-3在图中)。另一方面,当同一篇论文被指派由白人男性作家撰写时,它与一部高质量的论文和一部低质量的论文配对三遍(对于论文1,参与者4-6)和两篇低质量的论文三对。次(论文1,参与者7-9)。 低质量的论文也存在类似的问题。当低质量的论文有非白人男性作者时,通常会以低质量的论文和高质量的论文来见(关于论文3,请参见参与者7-9)。但是,当同一篇文章中有一位白人男性作者时,可以看到一篇高质量的论文和一篇低质量的论文三遍(对于论文3,参与者10-12),而两次高质量的论文则是三遍(对于论文3,参与者1-3)。 上述模式可能存在问题的原因是,如果我们假设存在“对比效果”。具体而言,如果将高质量的论文与两份低质量的论文搭配在一起比在一篇低质量的论文和一份高质量的论文(合理的假设)上配对的平均评价更好,那么白人男性论文可能会获得比白人女性,黑人男性和黑人女性散文是作者身份以外的原因。 低质量论文的对比效果可能会或可能不会平衡高质量论文的对比效果;也就是说,对低质量论文和两篇高质量论文进行配对的情况可能会,也可能不会,特别是不利。无论如何,我的同事认为,任何形式的对比效果都可能使该设计成为问题,以便确定白人男性撰写的论文是否比其他作者的论文更受好评。 为什么我相信潜在的困惑不是问题 对我来说重要的是,即使存在对比效应,我们是否能够估计白人男性论文与其他论文的评价程度(即我们是否可以估计我们感兴趣的效果)。因此,我进行了一次模拟,在其中模拟了50个包含对比效果并适合测试我们感兴趣的效果的数据集。 具体模型是一种混合效果模型,具有随机的文章截距(每篇论文由多个参与者评估)和参与者(每个参与者评估多篇论文)。文章级别还包含种族,性别及其相互作用的随机斜率(这两个变量都在文章中操纵),参与者级别也包含质量的随机斜率(质量在参与者内部操纵)。兴趣的影响是种族,性别,种族与性别之间的相互作用以及这些变量和质量中的每一个之间的高级交互作用的影响。此模拟的目的是确定在数据中引入对比效果是否会造成种族,性别,种族与性别之间的相互作用,以及这些变量和质量之间的高级交互作用。有关更多详细信息,请参见下面的代码块。 根据模拟,对比效果的存在不会使我们感兴趣的任何效果的估计值产生偏差。此外,可以在与设计中其他效果相同的统计模型中估算对比效果的大小;对我来说,这已经表明我的同事所确定的“对比效果”并不是一个困惑。但是,我的同事仍然持怀疑态度。 require(lme4) require(plyr) participant <- rep(1:12, 3) essay <- c(rep(1, 9), rep(2, 9), rep(3, 9), rep(4, 9)) quality <- ifelse(essay == 1 | essay == 2, …

2
鲁宾因果模型中的无疑之处-莱曼的解释
在实施鲁宾的因果模型时,我们需要的(不可笑)假设之一是无混杂感,这意味着 (Y(0),Y(1))⊥T|X(Y(0),Y(1))⊥T|X(Y(0),Y(1))\perp T|X LHS是反事实,T是治疗方法,X是我们控制的协变量。 我想知道如何将其描述给对鲁宾因果模型了解不多的人。我理解为什么从理论上讲我们需要这个假设,但是从概念上我不确定为什么这很重要。具体来说,如果使用T作为治疗方法,那么潜在的结果是否应该非常依赖于它?同样,如果我们有一个随机对照试验,然后自动,(Y(0),Y(1))⊥T(Y(0),Y(1))⊥T(Y(0),Y(1))\perp T。为什么这适用呢? 您将如何向未学习RCM的人描述“无足轻重/无知”的假设?

3
出版物中有哪些潜伏变量在受控实验中的例子?
在本文中: 潜伏变量:一些示例 Brian L. Joiner,《美国统计学家》第 35,第4号,1981年11月227-233 布莱恩·乔纳(Brian Joiner)声称“随机化不是万能药”。这与以下常见声明相反: 一个经过精心设计的实验包括一些设计功能,这些功能使研究人员可以消除无关的变量,以解释所观察到的自变量与因变量之间的关系。这些无关的变量称为潜伏变量。 引文来自这个问题,没有任何消息来源,但以我的经验,它代表了当时的主流态度: 潜伏变量和有影响力的观察的例子 给出的一个例子是,在70年代测试40号红色食用染料对啮齿动物的安全性(特别是致癌作用)时,发现笼子位置的影响使这项研究感到困惑。现在,我已经阅读了许多研究啮齿动物致癌作用的期刊文章,却从未见过有人报告过控制这种作用的报道。 这些研究的进一步讨论可以在这里找到: 监管过程中的统计案例研究:FD&C Red No. 40实验。 我找不到非付费版本,但以下是摘录: 在1月的会议上,我们进行了初步分析(14),该分析揭示了笼行与RE(网状内皮肿瘤)死亡率之间的密切相关,其死亡率从17%(下排)到32%(上排)不等(表2)。我们无法通过性别,剂量组,机架列或位置来解释这种强烈的关联。随后的分析(18)也表明笼子的位置(前部和后部)可能与非RE死亡相关,而该位置与非RE死亡时间相关。 我特别想知道为什么医学文献中的复制似乎存在这样的问题,但是欢迎所有领域的例子。请注意,我对随机对照实验(而非观察性研究)中的示例感兴趣。


1
为什么Anova()和drop1()为GLMM提供了不同的答案?
我有以下形式的GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 当我使用时drop1(model, test="Chi"),我得到的结果与Anova(model, type="III")从汽车包装或汽车上获得的结果不同summary(model)。后两个给出相同的答案。 通过使用大量虚构数据,我发现这两种方法通常没有区别。对于平衡线性模型,不平衡线性模型(不同组中的n不相等)和平衡广义线性模型,它们给出相同的答案,但对于平衡广义线性混合模型,它们给出相同的答案。因此看来,只有在包括随机因素的情况下,这种矛盾才会显现出来。 为什么这两种方法之间存在差异? 使用GLMM时应使用Anova()还是drop1()应使用? 至少就我的数据而言,两者之间的差异很小。哪一个使用都重要吗?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.