作为应用统计学家/计量经济学家,我应该知道哪种因果关系理论方法?
我知道(一点点)
- Neyman–Rubin因果模型(以及Roy,Haavelmo等)
- 珍珠的因果关系工作
- 格兰杰因果关系(尽管较少以治疗为导向)
我想念或应该了解哪些概念?
相关:哪些理论是机器学习因果关系的基础?
我已阅读这些有趣的问题和答案(1,2,3),但我认为这是一个不同的问题。我很惊讶地发现,例如《统计学习要素》中没有提到“因果关系” 。
作为应用统计学家/计量经济学家,我应该知道哪种因果关系理论方法?
我知道(一点点)
我想念或应该了解哪些概念?
相关:哪些理论是机器学习因果关系的基础?
我已阅读这些有趣的问题和答案(1,2,3),但我认为这是一个不同的问题。我很惊讶地发现,例如《统计学习要素》中没有提到“因果关系” 。
Answers:
严格来说,“格兰杰因果关系”根本不是因果关系。关于预测能力/时间优先权,您想检查一个时间序列对预测另一个时间序列是否有用-它适用于诸如“通常A在B发生之前发生”或“知道A可以帮助我预测B将会发生,但并非相反”(即使考虑了有关所有过去信息)。选择此名称非常不幸,这是造成一些误解的原因。
尽管原因必须在时间上先于事态几乎是没有争议的,但要想在时间上先于因果关系得出结论,您仍然需要声称没有混淆,以及其他虚假联系。
现在关于潜在结果(Neyman-Rubin)与因果图/结构方程模型(Pearl),我想这是一个错误的难题,您应该两者都学习。
首先,必须注意,这些不是因果关系的对立观点。正如Pearl所说,关于(因果)推理任务有一个层次结构:
对于第一个任务,您只需要知道观察变量的联合分布即可。对于第二项任务,您需要了解关节分布和因果结构。对于反事实的最后一项任务,您将进一步需要一些有关结构方程模型的功能形式的信息。
因此,在谈论反事实时,两种观点之间存在形式上的对等。不同的是,可能的结果取反语句作为原语和在DAG的反事实似乎是作为衍生自结构方程。但是,您可能会问,如果它们是“等效的”,为什么还要花时间学习两者?因为表达和派生事物的“易用性”存在差异。
例如,尝试仅使用潜在结果来表达M-Bias的概念-我从未见过好的结果。实际上,到目前为止,我的经验是从未研究过图形的研究人员甚至都没有意识到这一点。同样,用图形语言来铸造模型的实质假设将使计算上更容易得出经验可检验的含义并回答可识别性问题。另一方面,有时人们会发现首先直接考虑反事实本身,然后将其与参数假设结合起来以回答非常具体的查询会更容易。
人们还有很多话要说,但是这里的重点是您应该学习如何“说两种语言”。作为参考,您可以在此处查看如何入门。