我对统计老师说的以下问题有疑问。我的问题甚至不在这种情况下发生的辛普森悖论上。我的问题仅仅是我的教授坚持认为A)和D)是正确的答案,而不是A)和F)。他说:
“由于E型手术的成功率很低,我们可以得出结论,这很困难,而且不仅仅罕见。因此,与Hope相比,Mercy可能拥有更好的设备/医生。”
我不了解他如何从统计学上推断出Mercy做了“更困难的手术”。Mercy显然在E型手术中具有更高的成功率,但是为什么这意味着他们进行“更困难的手术”。我想我被这个问题的措词所困扰,而教授并没有让步。有人可以向我解释为什么我错了,或者如何向教授解释这一点吗?
您所在的镇有两家名为Mercy和Hope的医院。您必须选择其中一项进行操作。您决定以他们的外科团队的成功为基础。幸运的是,根据新的医疗计划,医院会提供有关手术成功与否的数据,这些数据分为五大类。假设您获得了两家医院的以下数据:
Mercy Hospital
Type A B C D E All
Operations 359 1836 299 2086 149 4729
Successful 292 1449 179 434 13 2366
Hope Hospital
Type A B C D E All
Operations 88 514 222 86 45 955
Successful 70 391 113 12 2 588
您会注意到,在所有类型的操作中,Mercy的成功率均高于Hope,但Hope的总体成功率最高。您会选择哪家医院,为什么选择(选择两个答案)?
A)怜悯;因为我要进行特定的手术,所以我希望该手术的成功率最高的医院。
B)希望;由于它们在所有类别中执行的操作较少,因此它们不像Mercy那样“操作愉快”。
C)希望;这是辛普森悖论的一个例子,我们应该始终选择“显而易见”的结论。
D)怜悯;从E栏来看,Mercy显然要进行更困难的手术,因此可能是一家更好的医院。
E)希望;它具有更好的总体成功率。
F)怜悯;这是辛普森悖论的一个例子,我们应该始终选择与“显而易见”结论相反的结论。