应该选择哪家医院?一个具有较高的成功率,但另一个具有较高的总体成功率


27

我对统计老师说的以下问题有疑问。我的问题甚至不在这种情况下发生的辛普森悖论上。我的问题仅仅是我的教授坚持认为A)和D)是正确的答案,而不是A)和F)。他说:

“由于E型手术的成功率很低,我们可以得出结论,这很困难,而且不仅仅罕见。因此,与Hope相比,Mercy可能拥有更好的设备/医生。”

我不了解他如何从统计学上推断出Mercy做了“更困难的手术”。Mercy显然在E型手术中具有更高的成功率,但是为什么这意味着他们进行“更困难的手术”。我想我被这个问题的措词所困扰,而教授并没有让步。有人可以向我解释为什么我错了,或者如何向教授解释这一点吗?


您所在的镇有两家名为Mercy和Hope的医院。您必须选择其中一项进行操作。您决定以他们的外科团队的成功为基础。幸运的是,根据新的医疗计划,医院会提供有关手术成功与否的数据,这些数据分为五大类。假设您获得了两家医院的以下数据:

Mercy Hospital

Type         A    B      C    D      E    All
Operations  359  1836   299   2086  149  4729
Successful  292  1449   179   434   13   2366

Hope Hospital 

Type          A   B  C   D   E   All
Operations   88 514 222 86  45   955
Successful   70 391 113 12  2    588

您会注意到,在所有类型的操作中,Mercy的成功率均高于Hope,但Hope的总体成功率最高。您会选择哪家医院,为什么选择(选择两个答案)?

A)怜悯;因为我要进行特定的手术,所以我希望该手术的成功率最高的医院。

B)希望;由于它们在所有类别中执行的操作较少,因此它们不像Mercy那样“操作愉快”。

C)希望;这是辛普森悖论的一个例子,我们应该始终选择“显而易见”的结论。

D)怜悯;从E栏来看,Mercy显然要进行更困难的手术,因此可能是一家更好的医院。

E)希望;它具有更好的总体成功率。

F)怜悯;这是辛普森悖论的一个例子,我们应该始终选择与“显而易见”结论相反的结论。


哦,对不起,您说得对。我并没有真正看到有用于统计分析的SE网站。谢谢。
swiecki 2012年

不必难过。我只是在提醒您这个事实,以防您可能不知道。您可以单击“标志”链接,然后要求将其迁移到那里。它应该很快发生。顺便提一下(+1)。
主教

我将把这个问题迁移到statistics.SE网站。问题下方将出现一个链接,您可以在其中链接到问题的新位置。如果您需要有关在statistics.SE上关联帐户的帮助,则可以标记您的问题以引起主持人的注意,那里的人将为您提供帮助。
Zev Chonoles,2012年

Answers:


22

我认为A和E组合不好,因为A表示您应该选择Mercy,而E则应该选择Hope。

A和D具有提倡相同选择的优点。但是,让我们更详细地研究D中的推理路线,因为这似乎是一个混乱。在两家医院中,手术成功的可能性遵循相同的顺序,其中A型最可能成功,E型最不可能。如果我们崩溃(即忽略)医院,我们可以看到手术成功的边际概率为:

Type     A     B     C     D     E     All  
Prob   .81   .78   .56   .21   .08     .52

由于E 成功的可能性小得多,因此可以合理地想象它更加困难(尽管在现实世界中,还存在其他可能性)。我们也可以将思路扩展到其他四种类型。现在让我们看一下每种类型的医院在总外科手术中所占的比例:

Type     A     B     C     D     E  
Mercy  .08   .39   .06   .44   .03  
Hope   .09   .54   .23   .09   .05

我们在这里注意到的是,Hope倾向于在比较容易的AC(尤其是B&C)手术中做更多的事,而在D等较难的手术中做得较少。在这两家医院中,E都很少见,但是,就其价值而言,Hope实际上百分比更高。尽管如此,辛普森的悖论效应将主要由BD驱动(实际上并不是E列为答案D所建议的)。

辛普森悖论之所以发生,是因为手术的难度不同(通常),并且因为N的不同。正是由于不同类型的手术的基本费率不同,才使这种做法与直觉背道而驰。如果两家医院进行的每种手术的次数完全相同,那么将很容易发现发生的情况。我们可以通过简单地计算成功概率并乘以100来实现。这会针对不同的频率进行调整:

Type     A     B     C     D     E     All  
Mercy   81    79    60    21    09     250  
Hope    80    76    51    14    04     225

现在,由于两家医院都进行了100次手术(总共500例),答案显而易见:仁慈是更好的医院。


+1当您回答此问题时,我正在R中使用pbinom。:)
米歇尔(Michelle)2012年

1
哦,亲爱的,在查看您的答案时,我意识到我在提供详细信息时犯了一个小错误:我相信A)和F)是答案,而不是E),因为它显然不匹配。对于那个很抱歉。如果您愿意在评论F)旁发表其他意见或答案,我将非常乐于赞成它,当然接受此答复。
swiecki 2012年

2
所以不同意的是他说的是A&D,而你说的是A&F,对吗?如果您想说服他给您答案的分数,那么您可以说手术E并不是影响效果的主要驱动力,如我上面所示。OTOH,F并不是一个很好的答案,它在没有扎实的理解的情况下会引起人们对现象的认识。既然只有3种选择倡导Mercy(正确的医院)离开A&D。而且,即使不是最大的影响,手术E 也是效果的一部分。我会选择A&D,但答案设计不当。
gung-恢复莫妮卡

1
+1这是我对辛普森悖论的最清晰的解释(谢谢!)。其中一个很次要的事情-在你的最后一个表,我得到了最后一列略有不同的结果,第一行(github.com/RInterested/SIMULATIONS_and_PROOFS/blob/master/...
安东尼Parellada

1
@公阿!因此,您指的是百分比,而不是整数?
希腊-地区51提案

4

没有一个答案是完全没有根据的。但是它们都具有大量的外部知识,因此不能完全根据统计数据得出正确的结论。

A,B,D和E都需要对导致患者选择一家医院而不是另一家医院的因素做出假设;医生和患者的匹配过程,成功率在多大程度上归因于特定的手术类别以及诸如ICU之类的共享因素,等等。

在现实世界中,我们可以合理地考虑许多其他因素,例如医院正式接受的付款服务提供商,附近的社会经济状况和肥胖率,是否是教学医院(在这种情况下,当新的实习生到达时,成功率会直线下降,而我们必须考虑每月组合),并不断。

显然,我们可以并且确实对这些因素做出合理的假设,但是如果不专门解决这些问题或将它们排除在问题之外,就无法说出答案是否“正确”。


3

@gung给出了一个非常彻底的答案,但是D仍然是这个问题的正确答案还有一个原因:更好的医院会做更多的困难手术,因为它们会更好。就是说,如果某人进入霍普医院接受手术E(最困难),他们可能会将他/她送往慈悲,因为霍普医院的他们不知道该怎么做。

这甚至发生在现实世界中,最困难的案例被发送到更大或更专业的医院。


在示例中,“ E”操作不是最难的吗?同样,在问题中,我们知道操作E是在Hope和Mercy上执行的,因为我们都有它们的数据。
贾拉德

E是最难的,这是我的错误,但是,尽管两家医院都采用E,但它们所占E的比例却不相等。这是造成其自相矛盾的部分原因。
彼得·弗洛姆
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.