5
如何解决辛普森悖论?
辛普森悖论是世界范围内入门级统计课程中讨论的经典难题。但是,我的课程很满意,只是注意到存在问题并且没有提供解决方案。我想知道如何解决这个矛盾。也就是说,当面对辛普森悖论时,根据数据的划分方式,两个不同的选择似乎在争夺最佳选择,一个应该选择哪个呢? 为了使问题更具体,让我们考虑相关Wikipedia文章中给出的第一个示例。它基于有关肾结石治疗的真实研究。 假设我是一名医生,并且检查发现患者患有肾结石。仅使用表中提供的信息,我想确定是否应该采用治疗A或治疗B。似乎,如果我知道结石的大小,那么我们应该首选治疗A。但是如果不知道,那么我们应该更喜欢治疗B。 但是请考虑另一种可行的方式来获得答案。如果结石很大,我们应该选择A,如果结石很小,我们应该再次选择A。因此,即使我们不知道结石的大小,通过案例的方法,我们也应该选择A。这与我们先前的推理相矛盾。 所以:一位病人走进我的办公室。测试显示它们有肾结石,但没有提供有关它们大小的信息。我推荐哪种治疗方法?是否有解决此问题的公认方法? 维基百科暗示使用“因果贝叶斯网络”和“后门”测试的解决方案,但我不知道这些是什么。