Questions tagged «causality»

因果关系。

5
一个“控制其他变量”到底如何?
这是引起这个问题的文章:不耐烦会使我们发胖吗? 我喜欢这篇文章,它很好地展示了“控制其他变量”(IQ,职业,收入,年龄等)的概念,以便最好地隔离所讨论的两个变量之间的真实关系。 您可以向我解释一下如何实际控制典型数据集上的变量吗? 例如,如果您有2个人的耐心程度和BMI相同,但收入不同,您将如何处理这些数据?您是否将他们分为收入,耐心和BMI相似的不同子组?但是,最终有数十个变量需要控制(IQ,职业,收入,年龄等),然后如何汇总这些(潜在地)100个子组?实际上,现在我已经说了出来,我有一种感觉是这种方法使错误的树陷入困境。 感谢您为我几年来一直想深入了解的事情提供任何信息...!

8
因果关系暗示吗?
关联并不表示因果关系,因为可能有很多解释。但是因果关系是否暗示相关性?凭直觉,我认为因果关系的存在必然意味着一定的相关性。但是我的直觉并不总是在统计学上对我有用。因果关系暗示吗?

16
相关在什么条件下暗示因果关系?
我们都知道,所有第一年统计专业的学生都鼓吹“不代表因果关系”的口头禅。有一些很好的例子在这里说明的想法。 但是有时候关联确实暗示了因果关系。以下示例摘自该Wikipedia页面 例如,可以对同一对双胞胎进行一项实验,这些双胞胎在其测试中始终获得相同的成绩。一对双胞胎被送去学习六个小时,而另一对被送往游乐园。如果他们的考试成绩突然出现较大差异,这将有力证据表明学习(或去游乐园)对考试成绩有因果关系。在这种情况下,学习分数和考试分数之间的相关性几乎可以肯定是因果关系。 还有其他情况下关联暗示因果关系吗?

7
Judea Pearl撰写的《为什么》一书:他为何抨击统计数据?
我正在阅读Judea Pearl撰写的《为什么之书》,它正深入我的皮肤1。具体地说,在我看来,他通过提出一个稻草人的论点来无条件地抨击“古典”统计数据,即统计数据永远不会,永远无法研究因果关系,它永远不会对因果关系感兴趣,并且统计数据已成为一种模型盲数据缩减企业”。统计在他的书中成了丑陋的一句话。 例如: 统计人员对于应该控制和不应该控制哪些变量感到非常困惑,因此默认做法是控制所有可以测量的变量。[...]这是一个方便,简单的过程,但是它既浪费,又充满错误。因果革命的一项关键成就就是消除这种混乱。 同时,统计学家从根本不愿谈论因果关系的意义上大大低估了控制权。[...] 但是,因果模型一直以来都是统计数据。我的意思是,一个回归模型可以基本上被使用的因果模型,因为我们基本上假设一个变量是原因,另一个是效果(因此相关性是从回归建模不同的方法),并测试该因果关系是否解释了观察到的模式。 另一句话: 尤其难怪统计学家发现这个难题[蒙蒂·霍尔问题]很难理解。正如RA Fisher(1922)所说,他们习惯于“减少数据”,而忽略了数据生成过程。 这让我想起了安德鲁·盖尔曼(Andrew Gelman)写给著名的xkcd卡通有关贝叶斯和常客的回答:“不过,我认为该卡通整体上是不公平的,因为它将明智的贝叶斯人与常客统计学家相比,后者盲目地遵循浅薄的教科书的建议。 ”。 我认为,在Judea Pearls一书中存在的s词的错误陈述的数量使我怀疑是否因果推论(迄今为止,我认为这是组织和检验科学假设2的有用且有趣的方式)是否值得怀疑。 问题:您是否认为Judea Pearl歪曲了统计数据,如果是,为什么?只是为了使因果推理听起来比实际更大?您是否认为因果推论是一场R大的革命,它确实改变了我们的所有思维? 编辑: 上面的问题是我的主要问题,但是,由于它们是公认的,因此请回答以下具体问题(1)“因果革命”的含义是什么?(2)它与“正统”统计有何不同? 也因为他是如此谦虚。 2.我的意思是科学而非统计意义。 编辑:安德鲁·盖尔曼(Andrew Gelman)在《犹太珍珠》(Judea Pearls)的书上写了这篇博客文章,我认为他在解释这本书的问题上比我做得更好。这是两个引号: Pearl和Mackenzie在这本书的第66页上写道,统计数据“成为了模型盲的数据约简企业。”嘿!你他妈在说什么??我是统计学家,从事统计工作已有30年,从事从政治到毒理学的研究。“模型盲数据缩减”?那只是胡扯。我们一直在使用模型。 还有一个: Look. I know about the pluralist’s dilemma. On one hand, Pearl believes that his methods are better than everything that came before. Fine. For him, …
79 causality 



3
统计和因果推论?
保罗·霍兰德(Paul Holland)在1984年发表的论文《统计与因果推论》中提出了统计学中最基本的问题之一: 统计模型可以说明因果关系吗? 这导致了他的座右铭: 没有操纵就没有因果关系 强调了对考虑因果关系的实验进行限制的重要性。安德鲁·盖尔曼(Andrew Gelman)提出了类似的观点: “要发现当您更改某些内容时会发生什么,必须对其进行更改。” ...您从扰动系统中学到的东西是您从任何数量的被动观察中都无法发现的。 本文总结了他的想法。 从统计模型进行因果推断时应考虑哪些因素?
51 causality 


9
相关并不意味着因果关系;但是什么时候变量是时间呢?
我知道这个问题已经问过十亿次了,因此,在网上看后,我完全相信2个变量之间的相关性并不表示因果关系。在我今天的一次统计讲座中,我们做了一次物理学家的客座演讲,内容涉及统计学方法在物理学中的重要性。他说了一个惊人的声明: 相关性并不意味着因果关系,除非变量是时间。因此,如果某个自变量与时间之间存在很强的相关性,那么这也暗示了因果关系。 我以前从未听过这句话。物理学家/相对主义者对“因果”的看法与统计人员不同吗?

5
倾向得分与在回归中添加协变量相比有何不同?何时优先选择后者?
我承认我在倾向得分和因果分析方面还比较陌生。 作为一个新手,对我而言不明显的一件事是,使用倾向得分的“平衡”在数学上与在回归中添加协变量时发生了什么变化?该操作有何不同,为什么它(或它)比在回归中添加子群体协变量更好? 我看过一些对这些方法进行实证比较的研究,但是我没有看到关于这两种方法的数学性质的很好的讨论,为什么PSM却不适合因果关系而又不包括回归协变量。在这个领域似乎也有很多困惑和争议,这使得事情变得更加难以掌握。 对这个问题有什么想法,或者有什么好的资源/论文可以更好地理解两者之间的区别?(我正在慢慢浏览Judea Pearl的因果关系书,因此无需指出这一点)

3
统计独立性是否意味着缺乏因果关系?
两个随机变量A和B在统计上是独立的。这意味着在流程的DAG中:当然是。但这是否也意味着从B到A没有前门?(A⊥⊥B)(A⊥⊥B)(A {\perp\!\!\!\perp} B)P(A|B)=P(A)P(A|B)=P(A)P(A|B)=P(A) 因为这样我们应该得到。因此,如果是这样,统计独立性是否自动意味着缺乏因果关系?P(A|do(B))=P(A)P(A|do(B))=P(A)P(A|do(B))=P(A)

7
交叉验证可以用于因果推理吗?
在所有情况下,我都熟悉交叉验证,它仅用于提高预测准确性的目的。可以在估计变量之间的无偏关系时扩展交叉验证的逻辑吗? 尽管理查德·伯克(Richard Berk)的这篇论文演示了在“最终”回归模型中使用保留样本进行参数选择的情况(并演示了为什么逐步选择参数不是一个好主意),但我仍然看不到如何完全确保与基于逻辑和对象的先验知识选择模型相比,X对Y产生的影响的无偏估计不再是。 我要求人们举出一些例子,其中有人使用保留样本来帮助进行因果推论,或者使用一些一般性的文章来帮助我理解。我也毫不怀疑我的交叉验证概念是幼稚的,因此可以这么说。使用暂留样本似乎可以进行因果推断,但是我不知道有任何工作可以做到这一点,或者他们将如何做到这一点。 伯克论文的引文: 模型选择后的统计推断 ,作者:理查德·伯克(Richard Berk),劳伦斯·布朗(Lawrence Brown),琳达·赵(Linda Zhao)。26,No. 2(2010年6月1日),第217-236页。 此处为 PDF版本 这对由CHL小样本研究探索性数据分析问题促使这个问题。

8
预测和推理之间有什么区别?
我正在阅读“ 统计学习入门 ”。在第二章中,他们讨论了估计函数的原因。Fff 2.1.1为什么估计?Fff 我们可能希望估计f有两个主要原因:预测和推断。我们依次讨论每一个。 我已经读了好几次了,但是我仍然对预测和推理之间的区别还不清楚。有人可以提供差异的(实际)示例吗?

4
X和Y没有相关性,但是X是多元回归中Y的重要预测因子。这是什么意思?
X和Y不相关(-.01);但是,当我将X放入预测Y的多元回归中时,与其他三个(A,B,C)变量(相关)并列,X和另外两个变量(A,B)是Y的重要预测因子。请注意,另外两个( A,B)变量在回归之外与Y显着相关。 我应该如何解释这些发现?X可以预测Y的唯一方差,但是由于这些不相关(Pearson),因此难以解释。 我知道相反的情况(即,两个变量是相关的,但回归不显着),从理论和统计的角度来看,它们相对较容易理解。请注意,一些预测变量之间的相关性很高(例如,.70),但与我预期的实质多重共线性的程度不同。不过,也许我误会了。 注意:我之前曾问过这个问题,所以已经关闭了。合理的理由是,该问题与“ 回归如何显着而所有预测变量都不显着? ”这样的问题是多余的。“。也许我不理解另一个问题,但我认为这些问题在数学和理论上都是完全独立的问题。我的问题与“回归显着”是否完全独立。此外,有几个预测变量也很重要,而另一个问题包含的变量并不重要,因此我看不到重叠之处。如果由于我不理解的原因这些问题是多余的,请在关闭此问题之前插入一条评论。此外,我也希望向主持人关闭另一个问题,以避免相同的问题,但我找不到这样做的选择。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.